Я прочитал лемму Неймана – Пирсона из книги « Введение в теорию статистики », написанной Мудом, Грейбиллом и Боесом. Но я не понял лемму.
Может ли кто-нибудь объяснить мне лемму в простых словах? Что это заявляет?
Лемма Неймана-Пирсона. Пусть - случайная выборка из , где - одно из двух известных значений и , и пусть фиксировано.
Пусть положительная константа и быть подмножество , которые удовлетворяют:
Тогда критерий соответствующий критической области является наиболее мощным критерием размера для сравнению с
Выраженный словами, я понял, что два критерия определяют
(1) P [отклонение нулевой гипотезы | нулевая гипотеза верна] = уровень значимости
(2) отвергнуть нулевую гипотезу, когда отношение правдоподобия , некоторой положительной постоянной если попадают в критическую область
Тогда тест является самым мощным тестом из простой гипотезы .
- Почему это только для простых гипотез? Разве это не может быть сложная гипотеза? Правильно ли мое объяснение словами?
Недавно я написал запись в блоге с вопросом, в которой лемма Неймана Пирсона была написана простыми словами и приводится пример. Я нашел пример открытия глаза в смысле четкой интуиции по лемме. Как и в случае с вероятностью, она основана на функции массовой дискретной вероятности, поэтому ее легче выполнить, чем при работе с PDF-файлами. Кроме того, примите во внимание, что я определяю отношение правдоподобия как вероятность альтернативной гипотезы против нулевой гипотезы, вопреки вашему утверждению леммы. Объяснение то же самое, но скорее чем меньше, чем сейчас больше. Я надеюсь, что это помогает...
Те из вас, кто занимается анализом данных и прошли некоторые курсы статистики, возможно, познакомились с леммой Неймана-Пирсона (NP-лемма). Сообщение простое, демонстрация не так уж и сложна, но мне всегда было трудно понять, о чем идет речь. Читая книгу «Распространенные ошибки в статистике» от PIGood и JWHardin, я получил объяснение и пример, которые помогли мне получить представление о NP-лемме, которую я всегда пропускал.
Не на 100% математически совершенном языке, что нам говорит Нейман-Пирсон, является то, что самый мощный тест, который можно придумать для проверки данной гипотезы на определенном уровне значимости, дается областью отклонения, сделанной всеми возможными наблюдениями, полученными из этого теста с отношение правдоподобия выше определенного порога ... вахххх! Кто сказал, что это было легко!
Сохраняйте спокойствие и деконструируйте лемму:
Достаточно определений! (хотя, если вы внимательно посмотрите на них, вы поймете, что они очень проницательны!). Давайте перейдем к тому, что говорят нам Нейман и Пирсон: если вы хотите провести максимально возможный статистический тест с точки зрения его мощности, просто определите область отклонения, включив результаты теста, которые имеют наивысший коэффициент вероятности, и продолжайте добавлять новые тесты. результаты до тех пор, пока вы не достигнете определенного значения для количества раз, когда ваш тест будет отклонять нулевую гипотезу, когда она верна (уровень значимости).
Давайте посмотрим на пример, где, надеюсь, все сойдется. Пример основан на книге, упомянутой выше. Это полностью сделано мной, поэтому его не следует рассматривать как отражающее какую-либо реальность или личное мнение.
Представьте, что кто-то хочет определить, выступает ли кто-то за установление иммиграционных квот (нулевая гипотеза) или нет (альтернативная гипотеза), спрашивая свои чувства по отношению к Европейскому союзу.
Представьте, что мы знали фактическое распределение вероятностей для обоих типов людей относительно ответа на наш вопрос:
Давайте представим, что мы готовы принять ложноположительную ошибку в 30%, то есть в 30% случаев мы отвергнем нулевую гипотезу и предположим, что опрошенный человек против квот, когда он / она действительно для них. Как бы мы построили тест?
По словам Неймана и Пирсона, мы сначала взяли бы результат с наибольшим отношением правдоподобия. Это ответ «очень похоже на ЕС» с соотношением 3. С этим результатом, если мы предположим, что кто-то против квот, когда он / она сказал, что «действительно любит ЕС», 10% времени мы бы назначали по квотам людей как против (значимость). Однако мы бы правильно классифицировали людей с квотами только в 30% случаев (власть), поскольку не все в этой группе имеют одинаковое мнение о ЕС.
Похоже, это плохой результат с точки зрения власти. Тем не менее, тест не делает много ошибок при неправильной классификации для людей квоты (значимость). Поскольку мы более гибки в отношении значимости, давайте посмотрим на следующий результат теста, который мы должны добавить к пакету ответов, которые отвергают нулевую гипотезу (область отклонения).
Следующий ответ с самым высоким отношением правдоподобия - «как в ЕС». Если мы используем ответы «очень нравится» и «как» ЕС в качестве результатов теста, которые позволяют нам отвергнуть нулевую гипотезу о том, что кто-то претендует на квоты, мы бы неправильно классифицировали квоты для людей как не в 30% случаев (10% от «очень нравится» и 20% от «нравится»), и мы будем правильно классифицировать против квот людей в 65% случаев (30% от «очень нравится» и 35% от «нравится»). В статистическом жаргоне: наше значение увеличилось с 10% до 30% (плохо!), В то время как сила нашего теста увеличилась с 30% до 65% (хорошо!).
Это ситуация, которую имеют все статистические тесты. Там нет ничего такого, как бесплатный обед даже в статистике! Если вы хотите увеличить силу своего теста, вы делаете это за счет повышения уровня значимости. Или, проще говоря: если вы хотите лучше классифицировать хороших парней, вы сделаете это за счет того, что плохие парни будут хорошо выглядеть!
В основном, теперь мы сделали! Мы создали самый мощный тест, который мы могли бы использовать с данными данными и уровнем значимости 30%, используя метки «действительно нравится» и «нравится», чтобы определить, кто-то против квот ... мы уверены?
Что бы произошло, если бы мы включили на втором этапе после того, как был выбран ответ «действительно нравится», вместо «нравится», ответ «равнодушный»? Значение теста было бы таким же, как и раньше, при 30%: 10% для людей с квотой отвечают «действительно», как и 20% для людей с квотой - «не нравится». Оба теста были бы столь же плохи при неправильной классификации для лиц с квотой. Однако сила будет ухудшаться! В новом тесте мы получили бы мощность 50% вместо 65%, которые у нас были раньше: 30% от «очень нравится» и 20% от «безразлично». С новым тестом мы были бы менее точны при идентификации по квоте!
Кто здесь помог? Соотношение правдоподобия Неймана и Человека замечательная идея! Принимая каждый раз ответ с наивысшим отношением правдоподобия, мы смогли включить в новый тест как можно большую мощность (большой числитель), сохраняя при этом значимость (маленький знаменатель)!
источник
Контекст
(В этом разделе я просто собираюсь объяснить проверку гипотез, напечатать одну и две ошибки и т. Д. В своем собственном стиле. Если вам удобен этот материал, перейдите к следующему разделу)
Обычно в приложениях нулевая гипотеза соответствует некоторому статусу-кво, тогда как альтернативная гипотеза - это некое новое явление, которое вы пытаетесь доказать или опровергнуть, реально. Например, вы можете проверять кого-то на экстрасенсорные способности. Вы запускаете стандартный тест с картами с волнистыми линиями или нет, и заставляете их угадывать определенное количество раз. Нулевая гипотеза состоит в том, что они получат не более одного из пяти правых (поскольку есть пять карт), альтернативная гипотеза заключается в том, что они экстрасенсорные и могут получить больше прав.
Имея в виду пример теста психических способностей, я хотел бы сослаться на тип ошибки, при которой нулевое значение является истинным, но вы делаете вывод об альтернативе, такой же как « заблуждение » (вы верите, что парень экстрасенс, но он нет), и другой вид ошибки, как « забвение ».
Лемма
Покупка земли
Суть леммы заключается в следующем:
источник