Дыхание, ВУЛ, ВВЛ и всё такое
Здравствуй, друххх...Не ожидал тебя увидеть второй раз. Мне показалось, в первый, когда ты заснул, едва дойдя до конца, ты принял решение: "не возвращаться к этому ненормальному, который занимается такими странными для полиграфолога штуками". Но ты всё-таки пришёл, и я этому рад. Что бы тебя сюда не привело повторно: осознанный ли интерес, неосознанная ли тяга к чему-то ненормальному и странному - я приветствую тебя! И в сторону сантименты! Предлагаю заняться такой странной штукой как дыханием в ВУЛ. Для этого я раздобыл хороший материал. У меня есть 99 тестов "Однотемного скрининга с ВУЛ (ЮТА)" и сто тестов DLST. Многие говорят, что "Однотемный скрининг" — это очень странная штука! Возможно, они правы. Мы можем в это убедиться тем более, что всё странное и ненормальное — это наше, родное..."Наше" ...раз уж ты тоже здесь.
Итак, есть почти сто тестов однотемного скрининга. Я посчитал у каждого результата алгоритма "Сокол" на тестах этой выборки знаки лямбд дыхания...и узрел престранное...Вот оно, ниже в таблице
В 87 случаях из 99 лямбды дыхания имеют отрицательный знак. Если ты помнишь, мы а пришлый раз установили, что даже если в выборке одни лжецы, если на все проверочные темы даются лживые ответы, то и в этом случае только в 79 случаях из ста лямбды дыхания меньше нуля. Мы эту странность так просто не оставим и убедимся, что это не мираж, не наведённый злым духом морок. И оружием нашим будут мат.стат. тесты. Но это ещё не всё. Давай взглянем на DLST. Всего их сто штук, но в каждом из тестов две проверочные темы: R1 и R2. Алгоритм даёт решение по каждой теме в отдельности. Поэтому мы имеем выборку из двухсот решений алгоритма, и соответственно двести лямбду дыхания. Положительные и отрицательные значения этих лямбд распределились так
Различие распределений видно невооружённым взглядом. Но ненормальные во всём, не нормальны и в том, что не полагаются только лишь на своё зрение, как и на остальные органы чувств. Воспользуемся тем, что такая штуковина как t при достаточно больших объёмах выборок имеет стандартное нормальное распределение
Что обозначают все эти буковки в страшной и ненормальной формуле я сейчас распишу
Я надеюсь, ты узнал числа. Это частоты знаков лямбд из выборочных распределений. Ты уже сосчитал? Давай сравнимся. У меня получилась вот, что
Теперь давай, как в прошлый раз воспользуемся функцией НОРМ.РАСП.
Такое ничтожное значение достигаемого уровня значимости говорит о том, что нет ни одного шанса на то, что знаки лямбд дыхания взяты из одного распределения, из одной генеральной совокупности. Выглядит это ненормально. Как так? Структура тестов С-R-R-C-R-R-C одна и та же. В обоих тестах используются ВУЛ. Тесты обеих выборок проводились в ходе реальных скрининговых проверок. И вот тут могла собака порыться. Проценты значимых тем в этих выборках могут быть различны, хотя, с другой стороны, различие — это не должно быть существенным. Если только в ходе получения какой-либо из выборок не действовал неизвестный нам кадровый фактор. Что было бы ненормально…А если процент значимых тем примерно одинаков в обеих выборках, то это означает, что опрашиваемые люди дышали в этих тестах по-разному. Не смотря на их схожесть. Как будем проверять? Есть идеи. Ну, не может такого быть. В ненормальной голове обязательно должна валяться хоть какая-то ненормальная идея.
Давай вспомним как в прошлый раз мы устанавливали полезность дыхания. Сперва мы легко установили, что россияне и американцы в тестах с ВВЛ дышат одинаково. А затем определили числовую меру полезности, как оценку вероятности того, что лямбда дыхания даст положительный вклад в решение алгоритма. А может быть нам сравнить выборки с ВУЛ - ами с выборкой с ВВЛ с известным решением. Как думаешь это сделать? Да, верно. Мы не знаем процентов значимости проверочной темы. По-простому, мы не знаем сколько раз в этих выборках опрашиваемые врали. Ну, что ж, предлагаю старый, добрый, ненормальный метод - метод "научного тыка".
Обозначим вероятность значимости проверочной темы как альфа (если тебе так привычней, то считай альфу частотой признака - значимости, или частотой лживых ответов на проверочные темы, или долей значимых тем). И предположим, что полезность дыхания в тестах, для начала однотемного скрининга, и тестах с ВВЛ одинакова. Предположим, и проверим это предположение. Исходя из него, получим распределение знаков лямбд, которое должно наблюдаться в выборке. Получим ожидаемые частоты из следующих формул
Для = 0,3. Т.е. для случая, когда для 30% опрашиваемых проверочная тема теста значима, будем иметь частоты положительного и отрицательного знака лямбды дыхания равные тем, что приведены ниже
Ничтожно малое значение достигаемого уровня значимости говорит о том, что одно из наших предположений не верно. Изменим альфу. Положим её 0,5. Т.е. для 50% опрашиваемых для которых проверочная тема теста значима будем иметь частоты положительного и отрицательного знака лямбды дыхания равные тем, что ниже
Значение p-value увеличилось, но по-прежнему ничтожно. Если положить, что в выборке тестов однотемного скрининга лгали 99% опрашиваемых, то значение достигаемого уровня значимости будет равна 0,03. Т.е. даже в этом случае предположение о том, что опрашиваемые дышат в этих тестах так же как и в тестах с ВВЛ будет отклонятся на уровне значимости 0,05. И более того, если в этой выборке лгали все опрашиваемы, то p-value = 0,045. Какой вывод будем делать коллега? Тут вариантов не много. Вывод: на уровне значимости 0,05 опрашиваемые в тестах однотемного скрининга дышат не так как в тестах с ВВЛ. Как так может быть? В чём причина? Есть один вариант - выборка невалидна. Правда думать так оснований мало, почти нет. Любое другое объяснение пусть уже дают другие полиграфологи - более нормальные, чем мы с тобой.
Теперь обратим свой ненормальный взор на выборку DLST. Проделаем те же манипуляции, что с предыдущей выборкой. Ниже результаты вычисления p-value в зависимости от альфы, или процента значимых тем, что-то же процента тем, на которые опрашиваемые лгали в тестах.
Только если в выборке DLST значимых тем примерно 50%, только в этом случае мы можем говорить, что в DLST с ВУЛ-ами люди дышат так же как и в тестах с ВВЛ. Может быть 50%? Однозначно ответить на этот вопрос сейчас нельзя. Но на данный момент это представляется маловероятным. Окончательный, "стопроцентный" результат можно дать только имея хорошую и точную оценку процента значимых тем в кадровом скрининге, либо имея выборку тестов DLST с известным решением.
Вот такой ненормальный результат мы получили сегодня коллега. В тестах однотемного скрининга с ВУЛ-ами люди дышат иначе чем в тестах с ВВЛ. Дыхание в этих тестах задаёт жёсткий обвинительный тренд. При пересчёте результатов на выборке, с исключением дыхания, количество "обвинительных" результатов уменьшилось почти в два раза, так же более чем на 50% возросло количество "оправдательных" результатов, и почти в полтора раза уменьшилось число неопределённых результатов. В DLST так же используются ВУЛ - ы, но в этом случае вклад дыхания в результаты алгоритмов отличается от случая однотемного скрининга, и почти наверняка отличается от случая тестов с ВВЛ. При исключении дыхания в выборке DLST количество "обвинений" уменьшилось на четверть, примерно на 5% процентов возросло количество оправдания, но вот правда, количество неопределённых результатов увеличилось на 20%.
Ну ты как, "моск" не вскипел? Ну, понятно. Отдохни, переключись на нормальные дела. Но если что, если зазундит, то заходи на огонёк - продолжим заниматься чем-нибудь ненормальным и странным.