Вступление
На заключительной стадии мероприятия по опросу на полиграфе для диагностирования (выявления) субъективной ложности/истинности ответов опрашиваемого лица на проверочные вопросы теста, иначе – значимости/незначимости для опрашиваемого проверочных стимулов теста, полиграфолог должен отнести полиграмму теста к полиграммам, характерным для лиц, которые лгали, отвечая на проверочные вопросы, либо, наоборот, к характерным для лиц, отвечавших правдиво. Иначе говоря, полиграфолог должен осуществить процедуру отнесения (классификации) полиграммы к одному из двух классов.
«Разделение рассматриваемой группы объектов или явлений на однородные (в определённом смысле) группы называется классификацией. …. Это понятие тесно связано с такими терминами как группировка, типологизация, дискриминация, кластеризация и является одним из основополагающих в практической и научной деятельности человека» [2, стр. 43].
Алгоритм — это конечный набор правил, который определяет последовательность операций для решения конкретной задачи. Действия, вычисления, совершаемые с целью классификации, называются алгоритмом классификации. В настоящее время алгоритмов классификации полиграмм разработано множество, но подавляющая их часть создана за пределами России. Существующие немногочисленные отечественные алгоритмы (как алгоритмы ручного обсчёта, так и автоматические) отличаются либо высокой степенью закрытости, которая приводит к тому, что у пользователя нет даже теоретической возможности понять, как они работают, либо имеющееся скудное их описание в литературе не даёт ответа на возникающие вопросы. Таким образом, можно говорить о проблеме конструктной валидности отечественных алгоритмов классификации полиграмм. И во всех случаях отсутствует информация о практических испытаниях алгоритмов, в ходе которых была бы дана оценка таким основным параметрам алгоритмов, как чувствительность и специфичность (избирательность). То есть, имеется неразрешённая проблема критериальной валидности российских алгоритмов принятия решения.
В настоящее время алгоритм классификации полиграмм «Сокол» является единственным отечественным алгоритмом, который обладает и конструктной валидностью и критериальной [3][4]. Более того, сейчас заканчивается разработка алгоритма Out_LIEr CQT, и благодаря этому оба алгоритма будут обладать (де-факто уже обладают) конвергентной валидностью.
Модель предметной области
Проведённые статистические испытания алгоритмов «Сокол» и Out_LIEr на одной и той же независимой выборке полиграмм показали высокую согласованность результатов алгоритмов – их высокую положительную корреляцию. Это при том, что алгоритмы используют разные математические идеи. Но вместе с тем, в основе обоих алгоритмов (за исключением определённого нюанса в пункте 3 в случае алгоритма Out_LIEr) лежат одни и те же положения из предметной области, которые перечислены ниже:
1. Вегетативные реакции при
субъективно ложном и субъективно истинном ответе на вопросы теста различаются друг от друга;
2. Наиболее адекватно отражают физиологические процессы, связанные с типом даваемых ответов, так называемые «параметры Кирчера» [9], [10], а также уменьшение амплитуды ФПГ;
3. Статистически реакции, сопровождающие ложный ответ на проверочный вопрос, превышают реакции на специальный вопрос, используемый для сравнения; а реакции, сопровождающие правдивый ответ, меньше реакций на вопрос сравнения.
Справедливость первого положения показана в многочисленных зарубежных исследованиях [11], и проведенных в России исследований Поповичева С.В. [6]. Без верности этого положения невозможно было бы говорить о справедливости положения 3. В «параметры Кирчера», эффективность которых была оценена в исследованиях американских специалистов [9], [10] входят: длина линии дыхания, амплитуда электродермальной активности (ЭДА), также известной как канал кожногальванической реакции (КГР), амплитуда подъёма манжеты. В последнее время было показано, что амплитуда кривой ФПГ также является высокоинформативным показателем в оценке реакции [12]. Использование признаков, которые несут максимальную информацию, пригодную для классификации/диагностики – это необходимое требование для повышения эффективности и точности алгоритма, которое является общенаучным принципом.
«Любое практическое исследование с применением методов статистической классификации включает в себя в виде специального этапа отбор информативных для классификации переменных. Дело здесь заключается не столько в экономии затрат на сбор не- или малоинформативных признаков, сколько в том … что включение в решающее правило в условиях дефицита выборочной информации малоинформативных признаков ухудшает среднюю эффективность классификации» [2, стр. 74].
Любой признак несёт в себе как информацию о диагностируемом свойстве, так и информацию, не связанную с ним, которая искажает полезную информацию. Малоинформативные признаки добавляют мало информации, но несут много шума, который подавляет полезную информацию в «хороших» признаках. С этой позиции можно говорить о том, что «параметры Кирчера» несут максимум необходимой для классификации полиграммы информации и минимум шумов. Это утверждение надо понимать, как справедливое для массивов полиграмм и не обязательно справедливое в каждом конкретном случае. Необходимость выбора информативных признаков для каждого конкретного опрашиваемого является требованием так называемой Метрической (измерительной) оценки полиграмм [5]. Автоматический выбор информативных признаков или, если точнее, выбор «весовых коэффициентов» – выборочных коэффициентов корреляции с КГР, предусматривает алгоритм QUEST [1]. Но в настоящее время не опубликованы исследования эффективности этого алгоритма, хотя достоверно известно, что алгоритм сравнивался в рамках внутренних испытаний, проведенных компанией Lafayette Instruments, после чего его внедрили в полиграфы данного американского производителя. О его критериальной валидности ничего сказать нельзя. Определение «параметров Кирчера» как эффективного признакового пространства может быть не окончательным решением для построения алгоритмов классификации полиграмм. Выбор наиболее подходящих признаков может быть осуществлён с помощью построения нейронных сетей. В данном случае сеть при обучении должна автоматически подобрать весовые коэффициенты признаков [13]. Переход к новому признаковому пространству (набору признаков физиологической реакции) может быть, например, осуществлён методом главных компонент – с использованием приёмов линейной алгебры.
Третье положение из предметной области, лежащее в основе алгоритма, является основным для инструментальной детекции еще с 1947, когда Джон Рид опубликовал статью по тесту MGKT, где добавил к тесту нейтральных и проверочных вопросов вопросы сравнения [14]. В последствии этот принцип неоднократно проверялся как в России [6], так и за рубежом [11]. Все существующие алгоритмы: ручные или компьютерные – используют этот принцип для построения выводов по полиграмме. Перечисленные положения, лежащие в основе алгоритма «Сокол», можно назвать моделью предметной области, на основе которой строится его математическое ядро.
Вычислительные процедуры алгоритма «Сокол»
Алгоритм Сокол анализирует выборки значений случайных величин, представляющих собой разность показателей признаков реакций в сравниваемых парах вопросов. Например, для ЭДА это будет разность амплитуд реакции на проверочный и контрольный вопрос. Для работы алгоритма необходимо, чтобы в тесте количество проверочных вопросов было не больше, чем вопросов контрольного характера. Каждому проверочному вопросу должен соответствовать свой контрольный, с которым будет производиться сравнение. С каждым контрольным вопросом сравнивается не более одного проверочного. Если по причине артефакта исключается контрольный вопрос, то проверочный вопрос можно сравнивать с любым ближайшим к нему, если он не ещё не использовался в другой паре сравниваемых вопросов. Если таким образом подобрать пару не получается, то и проверочный вопрос необходимо исключить. Каждый вопрос должен входить только в одну пару сравнения. При валидизации алгоритма производилось сравнение проверочного вопроса с контрольным, расположенным слева от него. В тестах, в которых контрольных вопросов больше, чем проверочных, при исключении одного контрольного вопроса для сравнения использовался ближайший, расположенный от него справа. В сравниваемых парах алгоритм вычисляет разности показателей признаков реакций. Для того, чтобы понять работу алгоритма, рассмотрим для примера данные канала ЭДА одного из тестов с тремя парами сравниваемых вопросов.