Алгоритм CλV Вектор. Что это такое и "с чем его едят" на пальцах.
Здравствуй, путник! Привел ли тебя в юдоль ненормального полиграфолога случай ‒ ненастье и трудности пути заставили заглянуть на огонёк, либо есть интерес к страданиям и печали, которые доставляет статистика ‒ я приветствую тебя! А может быть и так, что тебя интересует новый алгоритм классификации полиграмм? Тогда я тебе расскажу в чём суть этого алгоритма. И постараюсь при этом причинить тебе как можно меньше боли. Но немножко потерпеть придётся.
Для начала вспомним, что такое вектор. Вектор ‒ направленный отрезок. Он имеет начало и конец. Направление отрезка определяется направлением от начала к концу. Конец вектора обозначается «шляпкой» типа такой «^». Стрела, одним словом, этот вектор. Стрелу то ты видел? Можешь представить? Чего говоришь? Стрел у тебя полный колчан? Ну замечательно!
А чем вектор отличается от стрелы? Правильно в колчан его не положишь и в «партнёра» его из арбалета не всадишь. Потому как вектор ‒ это бестелесная сущность. Вектор ‒ это идея, обретающая в мире Платона. Но мы можем его нарисовать. Но рисовать его не обязательно. Его можно описать с помощью чисел и этого будет достаточно. Как? А вот так, например: (1,2). Такую запись называют кортежем. Вектор, который можно описать кортежем из двух чисел называют двухмерным вектором. А бывают и 3-х мерные и 4-х мерные и сколько угодно мерные векторы. Первое число в кортеже называют первой координатой вектора, второе ‒ второй и так далее для многомерных векторов. Почему координата, что такое координата?
Что, что? Голова уже опухла? А ты вспомни, что сказал мне, переступив через порог: «Удовольствие достигается через боль!». А потом ты сразу стал уверять меня, что ты не извращенец, не мазохист. Но это было излишне…я-то правду знаю… в мире Платона удовольствие достигается только так и никак иначе. А кроме того каждый уважающий себя полиграфолог громко говорит о себе, что он любит учиться. Так что терпи. Удовольствие придёт тогда, когда дослушаешь до конца. То есть придёшь к нему через свой девиз!
Так вот что бы вспомнить, что такое координата надо вспомнить, что такое координатная система. Если совсем просто, если для плоскости ‒ это две перпендикулярные прямые – координатные оси…Что такое перпендикулярные? Перпендикулярные ‒ это значит они пересекаются и угол между ними 90 градусов, ещё такой угол называют прямым. Что такое угол? Нет ну ты точно мазохист…Ладно нарисую. И координатную систему, и вектор, и его координаты увидишь своими глазами.
Начало вектора ‒ это точка. Координаты этой точки вектора, изображённого на рисунке ‒ это кортеж (1,1). Конец вектора — это тоже точка с координатами (2,3). Где 2 – это координата на оси ОХ, а 3 – координата на оси OY. А как же с координатами вектора? Как их получить? А вот так:
(1,2) = (2-1,3-1). Что бы получить первую координату вектора вычитаем из первой координаты конца вектора первую координату начала вектора. Для того что бы найти вторую координату вектора действуем аналогично.
Ты спрашиваешь, что мы можем делать с векторами? Что делать со стрелами ты знаешь хорошо, а что с векторами тебе не понятно. Вектора можно складывать. Причём делать это почти так же просто как с числами. Например, имеем два вектора (1,2) и (2,1). Их сумма находится так:
(1,2) + (2,1) = (1+2, 2+1) = (3,3). В координатной плоскости сложение векторов изображается вот так
Сложив оранжевый и синий вектор, мы получили новый – зелёненький. А ещё сложение векторов можно изобразить так, что будет полностью эквивалентно первому изображению.
Ну вот теперь ты умеешь складывать вектора. Стой! Ты чего делаешь!? А-а-а? Ты думаешь, что если ты сложишь две стрелы, то получишь копьё. Ну-ну, попробуй, поупражняйся. А я пока продолжу.
На картинках мы имеем, как мы начинаем думать интуитивно, пространственные вектора. Вектора, которые строятся в модели физического пространства. Но такая же модель может подойти для любого другого не физического пространства. Да-да. В мире Платона существует множество пространств самой различной природы. В том числе и пространство параметров физиологических реакций на стимулы. Давай увидим его и увидим вектора, которые в нём водятся. Для этого нам нужны данные какого-нибудь теста.
Возьмём такой «кусочек» реального теста. Напомню, что данные в зелёных ячейках – это физиологические показатели реакций на контрольный стимул, в красных – на проверочный стимул. Далее на примере ЭДА обнаружим «спрятавшийся» в нём вектор. Рассмотрим данные в первом столбце и построим такие вектора (14,37 - 22,1; 23,9 - 22,1) = ( -7,73; 1,8) – первый и (14,37 - 28,35; 23,9 - 28,35) = (-13,98; -4,45) – второй. Имеем два вектора, которые мы можем сложить. ( -7,73; 1,8) + (-13,98; -4,45) = (-21,71; -2,65). Теперь мы получили суммарный вектор в пространстве реакций ЭДА. В Векторе делается практически то же самое, за исключением того, что над векторами физиологических реакций делается некоторое преобразование, о котором я не буду тебе сейчас рассказывать, что бы ты не убежал с воплями «Куда меня занесло!», так и не постигнув платоновского Дзэна.
Для полной версии теста для каждого физиологического параметра составляется множество подобных векторов и производиться их суммирование. В итоге имеем такую картинку.
В пространстве физиологических параметров существует выделенное направление, которое можно условно назвать «ложь-правда». Если суммарный вектор физиологического показателя имеет угол с этим направление меньше 90 градусов, то канал свидетельствует в пользе незначимости стимула. И чем ближе этот угол к нулю градусов, тем свидетельство это более твёрдо. И наоборот, чем ближе этот вектор к 180 градусам, тем увереннее канал показывает, что стимул значим.
Если всё это проделать для каждого канала, то для нашего мини теста мы получим три суммарных вектора…которые тоже можно сложить, но уже в более мерном общем для теста пространстве. Опять получим суммарный вектор, но уже «окончательный», в пространстве в котором существует такое же выделенное направление «правда-ложь». И тогда угол «окончательного» вектора с этим направлением будет давать свидетельство в пользу значимости или незначимости.
Я взял имеющуюся у меня выборку полиграмм с известным решением о значимости/незначимости стимула и для каждой из них посчитал «окончательные» углы. Таким образом я получил две выборки. Оказалось, что для обоих случаев эти выборки принадлежат распределениям, которые очень хорошо описываются нормальным законом.
Получили два горба потому, что жизнь борьба. Замечательность этих «горбов» в том, что они накладываются друг на друга незначительно. Благодаря этому «окончательный» угол хорошо дискриминирует – классифицирует полиграммы. Достаточно только получить метрические данные, вычислить этот угол и применить теорему Байеса. Обрати внимание, что «горбы» пересекаются в районе 90 градусов. Это направление «шума», это когда 50 на 50, когда никакой информации нет.
О да ты уже совсем «осоловел»! Глаза на выкате, на раздражители не реагируешь. Это просто у тебя мозг заклинило. Бывает. Зато до удовольствия осталось совсем чуть-чуть. Понимаю, что задавать вопросы ты уже не способен, но думаю, что в другом состоянии ты спросил бы: а что это за направление «ложь-правда» и как его найти?
Отвечу просто: особенно сейчас тебе этого не понять. Но дам наводку. Найти это направление несложно, если воспользоваться той же идей, которая лежит в основе алгоритма Сокол, и которая заключена вот в этой картинке.
Ну вот и всё, если на пальцах. На улице погода уже наладилась – солнышко. И тебе пора по своим делам. Пускать стрелы в дичь. Да, да стрелой дичь подстрелить вполне реально, а вот с вектором такой фокус не пройдёт.
Ну, давай. Заходи если что.