ОСНОВНЫЕ ПРИНЦИПЫ И ПОНЯТИЯ АЛГОРИТМА КЛАССИФКАЦИИ ПОЛИГРАММ «СОКОЛ»
Летков Юрий Владимирович
Полиграфолог, разработчик СППРП «Сокол», г. Вологда, Россия
math-polygraph@yandex.ru
Калафати Александр Юрьевич
Руководитель проекта полиграф «Триумф», г. Москва, Россия
psy.akalafati@gmail.com

Аннотация. Рассмотрена модель предметной области, на основе которой построен алгоритм «Сокол», физиологические реакции на стимулы представлены в виде векторов, координаты, которых являются разностью показателей признаков реакций. Геометрическое представление реакций использовано для анализа связи реагирования на стимулы с их субъективной значимостью для опрашиваемого, и определения меры принадлежности к классу в виде достигаемого уровня значимости в тесте перестановочного критерия. С помощью линейной регрессии даётся оценка вероятности достоверности результата классификации.
Ключевые слова: алгоритмы классификации, алгоритм «Сокол»; функция оценки полиграмм косинусов; показатель детерминированности; оценка достоверности принятия решения.

BASIC CONCEPTS OF THE ALGORITHM FOR CLASSIFICATION OF POLYGRAMS "SOKOL"
Letkov Yuri Vladimirovich
Polygraph examiner, developer of SPPRP "Sokol", Vologda, Russia
math-polygraph@yandex.ru
Kalafati Alexander Yurievich
Project Manager of the polygraph «Triumph», Moscow, Russia
psy.akalafati@gmail.com

Abstract. In the article is presented the model which underlies the «Sokol» algorithm, physiological responses to stimuli are presented in the form of vectors, the coordinates of which are the differences in the indicators of reaction signs. The geometric representation of reactions was used to analyze the determinism of response to stimuli, and to determine the measure of class membership in the form of the achieved level of significance in the test of the permutation criterion. Using linear regression, an estimate of the probability of the reliability of the classification result is given.

Key words: classification algorithms, Sokol algorithm; function for evaluating polygrams of cosines; coefficient of determinism; assessment of the reliability of the decision.

Вступление

На заключительной стадии мероприятия по опросу на полиграфе для диагностирования (выявления) субъективной ложности/истинности ответов опрашиваемого лица на проверочные вопросы теста, иначе – значимости/незначимости для опрашиваемого проверочных стимулов теста, полиграфолог должен отнести полиграмму теста к полиграммам, характерным для лиц, которые лгали, отвечая на проверочные вопросы, либо, наоборот, к характерным для лиц, отвечавших правдиво. Иначе говоря, полиграфолог должен осуществить процедуру отнесения (классификации) полиграммы к одному из двух классов.

«Разделение рассматриваемой группы объектов или явлений на однородные (в определённом смысле) группы называется классификацией. …. Это понятие тесно связано с такими терминами как группировка, типологизация, дискриминация, кластеризация и является одним из основополагающих в практической и научной деятельности человека» [2, стр. 43].

Алгоритм — это конечный набор правил, который определяет последовательность операций для решения конкретной задачи. Действия, вычисления, совершаемые с целью классификации, называются алгоритмом классификации. В настоящее время алгоритмов классификации полиграмм разработано множество, но подавляющая их часть создана за пределами России. Существующие немногочисленные отечественные алгоритмы (как алгоритмы ручного обсчёта, так и автоматические) отличаются либо высокой степенью закрытости, которая приводит к тому, что у пользователя нет даже теоретической возможности понять, как они работают, либо имеющееся скудное их описание в литературе не даёт ответа на возникающие вопросы. Таким образом, можно говорить о проблеме конструктной валидности отечественных алгоритмов классификации полиграмм. И во всех случаях отсутствует информация о практических испытаниях алгоритмов, в ходе которых была бы дана оценка таким основным параметрам алгоритмов, как чувствительность и специфичность (избирательность). То есть, имеется неразрешённая проблема критериальной валидности российских алгоритмов принятия решения.

В настоящее время алгоритм классификации полиграмм «Сокол» является единственным отечественным алгоритмом, который обладает и конструктной валидностью и критериальной [3][4]. Более того, сейчас заканчивается разработка алгоритма Out_LIEr CQT, и благодаря этому оба алгоритма будут обладать (де-факто уже обладают) конвергентной валидностью.

Модель предметной области

Проведённые статистические испытания алгоритмов «Сокол» и Out_LIEr на одной и той же независимой выборке полиграмм показали высокую согласованность результатов алгоритмов – их высокую положительную корреляцию. Это при том, что алгоритмы используют разные математические идеи. Но вместе с тем, в основе обоих алгоритмов (за исключением определённого нюанса в пункте 3 в случае алгоритма Out_LIEr) лежат одни и те же положения из предметной области, которые перечислены ниже:

1. Вегетативные реакции при субъективно ложном и субъективно истинном ответе на вопросы теста различаются друг от друга;

2. Наиболее адекватно отражают физиологические процессы, связанные с типом даваемых ответов, так называемые «параметры Кирчера» [9], [10], а также уменьшение амплитуды ФПГ;

3. Статистически реакции, сопровождающие ложный ответ на проверочный вопрос, превышают реакции на специальный вопрос, используемый для сравнения; а реакции, сопровождающие правдивый ответ, меньше реакций на вопрос сравнения.


Справедливость первого положения показана в многочисленных зарубежных исследованиях [11], и проведенных в России исследований Поповичева С.В. [6]. Без верности этого положения невозможно было бы говорить о справедливости положения 3. В «параметры Кирчера», эффективность которых была оценена в исследованиях американских специалистов [9], [10] входят: длина линии дыхания, амплитуда электродермальной активности (ЭДА), также известной как канал кожногальванической реакции (КГР), амплитуда подъёма манжеты. В последнее время было показано, что амплитуда кривой ФПГ также является высокоинформативным показателем в оценке реакции [12]. Использование признаков, которые несут максимальную информацию, пригодную для классификации/диагностики – это необходимое требование для повышения эффективности и точности алгоритма, которое является общенаучным принципом.

«Любое практическое исследование с применением методов статистической классификации включает в себя в виде специального этапа отбор информативных для классификации переменных. Дело здесь заключается не столько в экономии затрат на сбор не- или малоинформативных признаков, сколько в том … что включение в решающее правило в условиях дефицита выборочной информации малоинформативных признаков ухудшает среднюю эффективность классификации» [2, стр. 74].

Любой признак несёт в себе как информацию о диагностируемом свойстве, так и информацию, не связанную с ним, которая искажает полезную информацию. Малоинформативные признаки добавляют мало информации, но несут много шума, который подавляет полезную информацию в «хороших» признаках. С этой позиции можно говорить о том, что «параметры Кирчера» несут максимум необходимой для классификации полиграммы информации и минимум шумов. Это утверждение надо понимать, как справедливое для массивов полиграмм и не обязательно справедливое в каждом конкретном случае. Необходимость выбора информативных признаков для каждого конкретного опрашиваемого является требованием так называемой Метрической (измерительной) оценки полиграмм [5]. Автоматический выбор информативных признаков или, если точнее, выбор «весовых коэффициентов» – выборочных коэффициентов корреляции с КГР, предусматривает алгоритм QUEST [1]. Но в настоящее время не опубликованы исследования эффективности этого алгоритма, хотя достоверно известно, что алгоритм сравнивался в рамках внутренних испытаний, проведенных компанией Lafayette Instruments, после чего его внедрили в полиграфы данного американского производителя. О его критериальной валидности ничего сказать нельзя. Определение «параметров Кирчера» как эффективного признакового пространства может быть не окончательным решением для построения алгоритмов классификации полиграмм. Выбор наиболее подходящих признаков может быть осуществлён с помощью построения нейронных сетей. В данном случае сеть при обучении должна автоматически подобрать весовые коэффициенты признаков [13]. Переход к новому признаковому пространству (набору признаков физиологической реакции) может быть, например, осуществлён методом главных компонент – с использованием приёмов линейной алгебры.

Третье положение из предметной области, лежащее в основе алгоритма, является основным для инструментальной детекции еще с 1947, когда Джон Рид опубликовал статью по тесту MGKT, где добавил к тесту нейтральных и проверочных вопросов вопросы сравнения [14]. В последствии этот принцип неоднократно проверялся как в России [6], так и за рубежом [11]. Все существующие алгоритмы: ручные или компьютерные – используют этот принцип для построения выводов по полиграмме. Перечисленные положения, лежащие в основе алгоритма «Сокол», можно назвать моделью предметной области, на основе которой строится его математическое ядро.


Вычислительные процедуры алгоритма «Сокол»

Алгоритм Сокол анализирует выборки значений случайных величин, представляющих собой разность показателей признаков реакций в сравниваемых парах вопросов. Например, для ЭДА это будет разность амплитуд реакции на проверочный и контрольный вопрос. Для работы алгоритма необходимо, чтобы в тесте количество проверочных вопросов было не больше, чем вопросов контрольного характера. Каждому проверочному вопросу должен соответствовать свой контрольный, с которым будет производиться сравнение. С каждым контрольным вопросом сравнивается не более одного проверочного. Если по причине артефакта исключается контрольный вопрос, то проверочный вопрос можно сравнивать с любым ближайшим к нему, если он не ещё не использовался в другой паре сравниваемых вопросов. Если таким образом подобрать пару не получается, то и проверочный вопрос необходимо исключить. Каждый вопрос должен входить только в одну пару сравнения. При валидизации алгоритма производилось сравнение проверочного вопроса с контрольным, расположенным слева от него. В тестах, в которых контрольных вопросов больше, чем проверочных, при исключении одного контрольного вопроса для сравнения использовался ближайший, расположенный от него справа. В сравниваемых парах алгоритм вычисляет разности показателей признаков реакций. Для того, чтобы понять работу алгоритма, рассмотрим для примера данные канала ЭДА одного из тестов с тремя парами сравниваемых вопросов.
Таблица 1.
Разности амплитуд ЭДА в парах стимулов.
Эти данные в алгоритме рассматриваются как вектор. Как оказалось, в таком представлении имеется ряд преимуществ: например, мы получаем способ приведения показателей разных признаков к одному масштабу, подобно тому, как это делается с помощью z преобразования. И получаем меру информативности признака реакции. Как это делается - показано ниже.

В геометрической интерпретации вектор – это направленный отрезок, каждый числовой компонент которого является координатой – проекцией на соответствующую ось. Для двух пар сравнения это будет двухмерный вектор, который можно изобразить на плоскости, а для трёх пар необходима трёхмерная система координат. Координаты вектора, изображённого на рисунке 1, будут равны х1 = 6,18, х2 = 2,25, х3 = 2,02. Косинус – угла вектора реакции с i-ой осью координат – даёт безразмерное число от -1 до +1. Значение этого числа не зависит от масштабов, в которых измеряются показатели физиологических признаков. С помощью такой функции все измеряемые физиологические показатели можно привести к единому масштабу.

Рисунок 1. Вектор физиологической реакции на стимул
Для каждой пары сравниваемых вопросов алгоритм вычисляет значение косинуса по формуле ( ):
Далее находит сумму косинусов. Эта сумма обозначается буквой
и названа суммарной ФОПК (функция оценки полиграмм косинусов).
Чем больше суммарная ФОПК, тем более уверенно физиологический показатель свидетельствует о том, что физиологическая система выдаёт реакцию именно на стимул. Максимальное значение, которое может принять ФОПК для трёх пар стимулов, равняется . Здесь 3 – это число пар сравниваемых стимулов. Суммарная ФОПК примет максимально возможное значение для трёх пар сравниваемых вопросов только в том случае, когда и в первой, и во второй паре физиологическая система отреагирует полностью одинаково:
При любом другом реагировании значение будет меньше, чем . Пример реагирования с максимальным значением лямбды изображён на рисунке 2.
Рисунок 2. Реагирование с максимальным значением лямбды.
Одинаковое реагирование физиологической системы на стимул в обеих сравниваемых парах вопросов означает отсутствие всяких помех, шумов, неконтролируемых факторов. Это говорит о чистом ответе физиологической системы на стимул. При этом не имеет значения величина разности показателей реакции в сравниваемых парах вопросов. Что значит чистый ответ системы на внешнее воздействие, в случае физиологии человека, представить сложно. Сложно представить реагирование человека при полном отсутствии неконтролируемых факторов как психологического, так и физиологического характера. Но это можно сделать в случае простой физической системы, например, в случае пружинки и грузика. Модель «чистого реагирования» системы на внешнее воздействие изображено на рисунке 3.
Рисунок 3. Модель «чистого реагирования» системы на внешнее воздействие
Подвешивая в лабораторных условиях к пружине грузик, мы будем каждый раз получать одно и тоже растяжение пружины, равное некоторому числу , которое будет являться показателем реакции системы на внешнее воздействие. Но если мы будем проводить подобные измерения в движущемся автомобиле, то из-за наличия ямок и кочек на дороге появятся неконтролируемые факторы – силы инерции, присутствие которых приведёт к тому, что каждый раз при измерении удлинения пружины (реагирования системы) мы получим различные значения

В произвольном случае, когда имеется пар сравниваемых вопросов (для всех повторов теста), косинус и суммарная ФОПК будут даваться следующими формулами:

Максимальное значение ФОПК будет равно:
где n – количество пар сравниваемых вопросов.

Доказательство методами математического анализа формулы (5) можно найти в [4]

В реальном случае показатель признака физиологической реакции является суммой из изменения, вызванного стимулом, и изменений, вызванных неконтролируемыми факторами. И чем ближе значение к корню квадратному из количества пар сравниваемых вопросов, тем меньше в физиологическом показателе шумовой составляющей, и тем больше составляющая предопределённая, детерминированная стимулами. Так как тесты могут иметь разное количество повторов и разное количество пар сравнения в повторе, полезно будет ввести показатель, который бы характеризовал, насколько физиологические показатели предопределены стимулами, и который бы не зависел от количества сравниваемых пар. Такой показатель назван «показателем детерминированности» (6). Его смысл близок к смыслу известного из математической статистики «коэффициента детерминации», который рассматривают как меру зависимости изменчивости одной случайной величины от других – объяснительных. В случае теста на полиграфе у нас имеется основная переменная, с помощью которой мы можем объяснить разницу показателей реакции - лжет человек или говорит правду. Это и является ключевым фактором, определяющим разницу в реакциях. О других переменных, имеющих иную природу и влияющих на разность показателей, мы ничего определённого сказать не можем, даже о их количестве, и относим их к шуму.

Показатель обозначен буквой греческого алфавита (эта). Если из единицы вычесть показатель детерминированности, то получим числовую меру зашумлённости физиологического признака реакции. Минимальное значение показателя равно нулю. При таком его значении реакция физиологической системы носит чисто стохастический характер, а предопределённая вопросами составляющая реакции отсутствует. На рисунке 4 изображено реагирование физиологической системы на две пары вопросов, для которой значения и, соответственно, будут равны нулю.
Рисунок 4. Реагирование с максимумом шума
Максимальное значение показателя равно единице (при реагировании как на рисунке 2). При таком его значение все реакции системы носят полностью детерминированный характер, в каждой паре сравниваемых вопросов разница физиологических параметров постоянна, а мера зашумлённости равна нулю.

Показатель детерминированности отражает свойство стабильности физиологического реагирования на стимулы. Чем показатель детерминированности ближе к единице, тем меньше разброс в разностях показателей реакций на стимулы в парах сравниваемых вопросов, и тем более информативен физиологический признак реакции. Под стабильностью физиологических реакций понимается близость разностей показателей признаков реакций на соответствующие типы вопросов во всех парах сравниваемых вопросов. Чем более стабильны реакции в физиологическом признаке, тем больший вклад он внесёт в результат теста. Кроме того, чем более синхронизированы разности реакций в разных физиологических признаках, тем больше будет суммарная ФОПК по всем показателям и сравниваемым парам, что позволит более уверенно принять решение по полиграмме. Под синхронностью понимается совпадение знаков разностей показателей признаков реакций в разных физиологических признаках. На рисунке 6 приведён пример полиграмм с высокой стабильностью и синхронности показателей физиологических признаков реакций на стимулы. Полиграммы записаны на полиграфе Lafayette. Данные для анализа взяты из программы OSS-3, которые формируются в ней автоматически. На рисунке 5 находится скриншот главного окна СППРП (система поддержки принятия решения полиграфолога) «Сокол» [8] с результатами анализа этой полиграммы.

Рисунок 5. Скриншот СППРП «Сокол» с результатами работы алгоритма
Алгоритм диагностировал ложь в ответах опрашиваемого на проверочные вопросы теста. Одинаковый знак у суммарных ФОПК ( физиологических признаков реакций говорит о высокой синхронности реагирования по каналам. Максимально достижимое значения модуля суммарной ФОПК для шести пар сравнения равняется
У ЭДА наблюдаемое значение лямбды достигает (-2,23), у Дыхания – (-2,17), что говорит о высокой стабильности реагирования в парах сравниваемых вопросов в указанных признаках.
Рисунок 6. Пример полиграммы с высокой согласованностью и синхронностью
Для Манжеты значение лямбды существенно меньше – (-1,28). Соответствующие значения показателей детерминированности: Дыхание – 0,89, ЭДА – 0,91, Манжета – 0,52. Надо сказать, что при ручном измерении показателей Манжеты (инструмент «Линейки» ПО LXSoftware) результат по этому признаку становится близким к результатам по остальным признакам – 0,85. Из приведённых данных можно сделать вывод, что наиболее информативным признаком в данной полиграмме является ЭДА, немногим ему уступает Дыхание. По сравнению с ними в Манжете содержится существенно больше шумовой информации, не связанной со стимулами. Шум большей частью является следствием неудовлетворительного автоматического измерения показателя в OSS3. В связи с этим необходимо отметить, что для удовлетворительной работы алгоритма необходим контроль над измеряемыми показателями со стороны полиграфолога, так как ПО полиграфов может проводить измерения реакций некорректно.

Для вынесения решения по всей полиграмме суммируются лямбды по всем признакам реакции. Сумма обозначается заглавной лямбдой . Чем дальше значение заглавной лямбды от нуля, тем более хорошая физиология на полиграмме в целом и тем увереннее можно принимать решение. Если суммарная лямбда меньше нуля – о лжи, больше нуля – о правдивости ответов на проверочные вопросы. Для рассматриваемой полиграммы значение заглавной лямбды равно (-5,68). Максимально возможное значение модуля заглавной лямбды для шести пар сравниваемых вопросов и для трёх физиологических признаков реакций равно
Как видно наблюдаемое значение близко к максимально возможному, что говорит о малом наличии шума в признаках реакций, большая часть которого приходится на канал Манжета.
Вычисление величины заглавной лямбды недостаточно для работы алгоритма. Надо принять решение о зоне неопределённости, научиться давать оценку вероятности достоверности диагностического заключения. Чтобы сделать это, надо знать закон распределения результирующих заглавных лямбд отдельно для классов правдивых и лживых. Заглавная лямбда — это случайная величина, и для разных тестов с разными количествами сравниваемых пар, разным количеством повторов, с исключениями реакций из обсчёта из-за артефактов будет иметь различные законы распределений. По существу – это семейство случайных величин. Что бы построить законы распределений для всего семейства необходимо огромное количество подтверждённых полиграмм, что представляет неразрешимую проблему. Но некоторая числовая мера, согласно которой можно относить полиграмму к тому или иному классу, необходима. Для её построения был использован тест из арсенала численного ресемплинга – тест перестановочного критерия. Суммарная лямбда является суммой ФОПК по всем физиологическим показателям и всем сравниваемым парам:
Если реагирование физиологической системы не детерминировано стимулами, то каждый из членов этой суммы с одинаковой вероятностью может принять как положительное значение, так и отрицательное, так как реакции на проверочной вопрос могут с вероятностью ½ превышать реакции на контрольный, так и наоборот. Это приводит к тому, что в такой ситуации и наблюдаемое значение заглавной лямбды с одинаковой вероятностью может иметь как положительный знак, так и отрицательный. То есть, заглавная лямбда будет иметь распределение с математическим ожиданием (генеральным средним) равным нулю. Для проверки этого предположения алгоритм поочерёдно меняет знаки у слагаемых суммы, получает различные значения заглавных лямбд, и таким образом, строит виртуальное распределение. А наблюдаемое значение заглавной лямбды служит статистикой критерия. После построения распределения алгоритм на основании статистики критерия вычисляет р-значение. На рисунке 7 можно видеть, что вычисляемое р-значение для нулевого распределения (с генеральным средним равным нулю) заглавной лямбды будет всегда больше р-значения, которое соответствует статистике критерия для генеральных совокупностей правдивых и лгущих.
Рисунок 7. Возможные распределения суммарной по тесту ФОПК
Поэтому чем меньше достигаемый уровень значимости, тем более уверенным можно быть в диагностическом заключении. В вычислении р-значения автоматически учитывается количество сравниваемых пар, и поэтому он позволяет по своему значению сравнивать результаты разных тестов с разным количеством сравниваемых пар.
Имея выборки полиграмм с известным решением из классов правдивых и лгущих, можно, меняя p–значения, подсчитывать, сколько диагностических ошибок совершается и, соответственно, сколько принимается правильных решений. Таким образом, была построена эмпирическая зависимость оценки вероятности достоверности диагностического решения от достигаемого уровня значимости на 300 полиграммах с известным решением. Оказалось, что она достаточно хорошо описывается линейной зависимостью, которую можно увидеть на рисунке 8. Были получены уравнения линейной регрессии, по которым и вычисляется оценка вероятности достоверности. Диагностическое решение выносится, если значение оценки превышает 95%.

Рисунок 8. Зависимость оценки вероятности достоверности от p-value
От параметров уравнений линейной регрессий зависят такие характеристики алгоритма как чувствительность, специфичность (избирательность) и процент неопределённых исходов. Определение этих параметров возможно только на массивах подтверждённых полиграмм. И чем больше массив, тем точнее будут определены эти параметры. Поэтому авторы призывают полиграфологов, заинтересованных в развитии алгоритма, присылать полиграммы с известным решением. 1


1 psy.akalafati@gmail.com или math-polygraph@yandex.ru

Заключение

Алгоритм «Сокол» был проверен на выборке из архива подтверждённых дел Национального центра оценки достоверности информации (США). Результаты его работы сравнивались с результатами американских алгоритмов. На выборке российских полиграмм производилось сравнение как с зарубежными алгоритмами, так и с российскими. Во всех случаях алгоритм «Сокол» показал не худшие результаты [3], [4]. В настоящее время алгоритм реализован в СППРП «Сокол» [7] и программном обеспечении полиграфа «Триумф2». Программа «Сокол» доступна для скачивания пользователями с декабря 2020 года. По настоящее время число скачиваний различных версий программы приближается к ста пятидесяти. До сих пор от пользователей не было получено критических замечаний по работе алгоритма, нареканий относительно его точности и достоверности результатов. Отсутствуют сообщения о том, что решение алгоритма находится в явном противоречии с экспертной оценкой полиграммы. Напротив, имеются положительные отзывы, которые специалисты-полиграфологи выкладывали на форуме «Эпос», в теме, в которой проводилось обсуждение алгоритма [7].

Авторы выражают благодарность канд. псих. наук, С. В. Поповичеву за сделанные им полезные замечания к рукописи и ценные предложения.


Список литературы

1. Алексеев Л.Г. Проблемы прикладной психофизиологии. – М.: БукиВеди, 2017. – 302с.

2. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д.; под ред. Айвазяна С. А. Прикладная статистика: Классификации и снижение размерности: Справ. изд. / – М.: Финансы и статистика, 1989, – 607 с.

3. Калафати А.Ю., Летков Ю.В. Краткий отчёт о ходе валидизации алгоритма «Сокол»//Детекция лжи. – 2021. № 3. – С.32-36

4. Летков Ю. В., Калафати А. Ю. 2020. Алгоритм классификации полиграмм «Сокол». PREPRINTS.RU. https://doi.org/10.24108/preprints-3112144

5. Молчанов А.Ю., Оглоблин С.И. Инструментальная детекция лжи: академический курс. – Ярославль: Нюанс, 2004. – 335 с.

6. Поповичев С.В. Ложь как психофизиологический феномен. //Детекция лжи. – 2020. № 2. – С.116-147

7. Сокол, просто Сокол. //Полиграф – форум, URL: http://ld.eposgroup.ru/forum/viewtopic.php?t=14273

8. СППРП Сокол: [сайт] /2020. – URL: http://mathpolygraph.tilda.ws/ (Дата обращения 20.07.2020)

9. Kircher J.C. and Raskin D.C., 1988. Human Versus Computerized Evaluations of Polygraph Data in a Laboratory Setting. Journal of applied psychology. 73(2) 291-302.

10. Kircher J.C., Kristjansson S.D., Gardner M.K., and Webb A. 2005 Human and Computer Decision-Making in the Psychophysiological Detection of Deception Polygraph, 2012 (reprint), 41(2) 77-126

11. Meta-Analytic Survey of Criterion Accuracy of Validated Polygraph Techniques Report. Prepared for The American Polygraph Association Board of Directors N. Gordon, President (2010-2011), by The Ad-Hoc Committee on Validated Techniques M. Gouger, Committee Chair R. Nelson, Principal Investigator M. Handler, D. Karol, P. Shaw, L. Bierman.

12. Honts C.R., Ready R. 2015 The comparison question polygraph test: A contrast of methods and scoring Physiology & Behavior 143 (2015) 15–26

13. Olsen, D. E., Harris, J.C., Capps, M.H., & Ansley, N. (1997). Computerized polygraph scoring system. Journal of Forensic Sciences, 42(1), 61-70.

14. John E. Reid 1947 A Revised Questioning Technique in Lie-Detection Tests. Journal of Criminal Law and Criminology (1931-1951), Vol. 37, No. 6 (Mar. - Apr.,1947), pp. 542-547