Во многих местах я читал, что мы никогда не можем сказать, что мы «принимаем» нулевую гипотезу. Вместо этого мы должны сказать, что мы «не можем отвергнуть» нулевую гипотезу.
Но я не вижу, как это согласуется с этим простым примером: предположим, мы тестируем лекарство, которое должно полностью излечить диабет в течение 24 часов. Мы пробуем это на 1000 пациентах, и у всех из них после приема препарата сохраняется диабет.
Разве не очевидно, что этот препарат не лечит диабет? то есть, что мы принимаем нулевую гипотезу?
Я бы точно не поверил в этот препарат.
Нулевая гипотеза: препарат не влияет на пациентов.
Альтернативная гипотеза: препарат лечит диабет
hypothesis-testing
Джонатан Акино
источник
источник
Ответы:
Возможность первая: препарат обладает очень небольшим эффектом. Возможно, это излечивает 0,0001% людей, принимающих его. Тест, который вы описали, только подразумевает, что недостаточно доказательств для предложенной вами драматической альтернативы.
Возможность вторая: препарат обладает очень сильным негативным эффектом. (кредит @ssdecontrol) Возможно, препарат не действует, и все эти пациенты поправились бы сами по себе, но благодаря этому препарату ни один из пациентов не выздоровел.
Без каких-либо предварительных знаний данные будут соответствовать этим возможностям, а также вероятности того, что значение NULL истинно.
Таким образом, отказ от отклонения нулевого значения не означает, что нулевое значение является более верным, чем эти другие возможности.
источник
Здесь есть несколько хороших ответов, но я думаю, что ключевой вопрос явно нигде не сформулирован. Короче говоря, ваша формулировка нулевых и альтернативных гипотез неверна. Нулевые и альтернативные гипотезы должны быть взаимоисключающими (то есть они не могут быть правдой). Ваша формулировка соответствует этому критерию. Однако они также должны быть коллективно исчерпывающими (то есть один из них должен быть правдой). Ваша формулировка не соответствует этому критерию.
У вас не может быть нулевой гипотезы о том, что лекарство имеет вероятности излечения диабета, и альтернативной гипотезе о том, что лекарство имеет вероятность излечения диабета. Представьте, что истинная вероятность того, что лекарство излечит диабет, составляет , тогда и ваша нулевая, и ваша альтернативная гипотеза неверны. Это твоя проблема.0% 100% 50%
Прототип нулевой гипотезы представляет собой точечное значение (например, в строке действительных чисел или чаще всего применительно к вероятностям, но это всего лишь условные обозначения). Кроме того, если вы работаете с ограниченным пространством параметров (как вы здесь - вероятности должны находиться в пределах ), обычно проблематично пытаться проверить значения, которые находятся в пределах (т. Е. или ). Выбрав значение точки , как ваш нулевой (значение , которое вы хотите отклонить), вы можете получить доказательства против него, но не можешь получить доказательства для него из ваших данных (см @ Джона проницательного ответа ). Чтобы понять это дальше, это может помочь вам прочитать мой ответ здесь:0 50% [0, 1] 0 1 Почему статистики говорят, что незначительный результат означает «вы не можете отвергнуть ноль», а не принять нулевую гипотезу? Чтобы применить эти идеи к вашей ситуации более конкретно, даже если ваш ноль был (и, следовательно, ваша альтернативная гипотеза была ), и вы пробовали препарат на пациентов без единого существа вылечить, вы не могли принять вашу нулевую гипотезу: данные все равно будут соответствовать вероятности того, что вероятность будет (см. Как определить вероятность отказа, если не было ошибок? ). 0% π≠0 100,000 0.00003
С другой стороны, вам не нужно иметь нулевую точку. Например, односторонние (т. ) нулевые гипотезы не являются точками. Это множества бесконечных точек. Кроме того, вы также можете иметь гипотезу диапазона / интервала (например, что параметр находится в пределах ). В этом случае вы можете принять свой нуль на основе доказательств - вот что такое тестирование на эквивалентность. (Вы все еще можете делать ошибку типа I, конечно.)<θ0 [a, b]
источник
Как прокомментировали другие пользователи, проблема с принятием нулевой гипотезы заключается в том, что у нас нет достаточных доказательств (и никогда не будет), чтобы сделать вывод, что эффект равен точно 0. Математически тестирование гипотез, как правило, не способно ответить на такие вопросы. ,
Однако это не означает, что цель вашего вопроса не является действительной! Фактически, это, как правило, цель клинических испытаний дженериков лекарств: цель не в том, чтобы показать, что вы произвели более эффективный препарат, а в том, что ваш препарат по сути примерно такой же эффективный, как и название бренда (и вы можете производить это по гораздо более низкой цене). Эквивалентность обычно считается нулевой гипотезой.
Чтобы ответить на этот вопрос с помощью проверки гипотез, вопрос реформируется таким образом, чтобы на него можно было ответить. Переформатированный вопрос выглядит примерно так:
где - это эффект дженерика, а - эффект от названия бренда. Так что теперь, если мы отвергаем нулевую гипотезу, мы можем заключить, что универсальный является по крайней мере на 75% столь же эффективным, как и торговая марка. Ясно, что это не то же самое, что сказать точно эквивалентный, но оно затрагивает вопрос, который вас интересует (и, как я полагаю, математически более разумный вопрос).β n bβg βnb
Мы можем подойти к вашему вопросу аналогичным образом. Вместо того, чтобы пытаться сказать «у нас достаточно доказательств, чтобы заключить нулевой эффект?», Мы можем спросить «учитывая наши доказательства, каков максимальный эффект, для которого наши результаты не были слишком необычными?». При и 0 успехах мы можем утверждать, что у нас достаточно доказательств, чтобы сделать вывод, что вероятность успеха составляет менее 0,3% (согласно точному критерию Фишера, ).n=1000 α=0.05
Исходя из этого, вы, безусловно, можете сделать вывод, что это не тот препарат, в который вы будете верить.
источник
Предположим, что препарат работает, но только на 0,00001% населения. Наркотик работает, точка. Каковы шансы обнаружения, статистически, что это работает на выборке 10000 человек? 100 000 человек? 1 000 000 человек?
источник
Неверно утверждать, что вы никогда не сможете принять нулевую гипотезу. Вы берете информацию из учебника вне контекста. То, что вы не можете сделать, это использовать тест нулевой гипотезы, чтобы принять его. Тест для отклонения гипотезы. Обратите внимание, что ваш собственный аргумент в пользу принятия имеет мало общего с результатами теста. Это о данных. Было бы довольно глупо запускать тест вообще в вашем примере. Вы можете использовать свои данные, чтобы доказать, что вы принимаете нулевую гипотезу. В этом нет ничего плохого. Вы просто не можете использовать результаты теста для этого.
Причина, по которой вы не можете использовать сам тест гипотезы, заключается в том, что он не предназначен для этого. Если вы не понимаете этого из учебников, это понятно. На самом деле интересный парадокс заключается в том, что значение p на самом деле означает что-то, только если значение равно нулю, но не может быть использовано для демонстрации того, что значение равно нулю. Чтобы сделать это проще, возможно, просто рассмотрите чувствительность к мощности. Вы всегда можете просто собрать слишком мало образцов и не отклонить ноль. Поскольку вы можете сделать это, ясно, что сам по себе тест не является веской причиной для принятия нулевого значения. Но опять же, это не значит, что вы никогда не сможете сказать, что ноль - это правда. Это только означает, что тест не является основанием для утверждения, что нулевое значение истинно.
ПРИМЕЧАНИЕ . Существует аргумент бритвы Оккама о том, что вы должны принять значение NULL, если вы не отклоняете его; но тест не говорит вам принять ноль. Что вы делаете, так это принимаете значение NULL как значение по умолчанию, и если вы не отклоняете тест, вы сохраняете состояние по умолчанию. Так что даже в этом случае ноль не принимается из-за теста.
источник
Просматривая ваши комментарии, я думаю, что вы очень заинтересованы в этом вопросе: почему мы можем накопить достаточно доказательств, чтобы отвергнуть нулевое значение , но не альтернативу , то есть, что делает проверку гипотез односторонней улицей?
Очень важно подумать о том, какие ценности составляют нулевую гипотезу? В вашем примере, это только одно значение, , . Альтернатива, наоборот, .i.e. p=0 p>0
Мы принимаем любую гипотезу, если все «разумные значения» (то есть значения внутри нашего доверительного интервала) полностью попадают в диапазон, заданный этой гипотезой. Поэтому, если все наши разумные значения больше 0, мы бы приняли альтернативу. С другой стороны, нулевая гипотеза - это всего лишь одна точка, 0! Таким образом, чтобы принять ноль, мы должны иметь доверительный интервал длины 0 . Так как (вообще говоря) доверительный интервал длины приближается к 0 как , но не достигает длины 0 для конечного , нам нужно было бы собрать бесконечное количество данных, чтобы сделать вывод, что у нас нет погрешности в нашем оценить.n→∞ n
Но обратите внимание, что если мы определим нулевую гипотезу как нечто большее, чем просто одну точку, то есть односторонний тест гипотезы, такой как
мы на самом деле можем принять нулевую гипотезу. Предположим, что наш доверительный интервал должен быть (0,35, 0,45). Все эти значения меньше или равны 0,5, что находится в области нулевой гипотезы. Так что в этом случае мы могли бы принять ноль.
Небольшое техническое замечание о злоупотреблении статистикой: если кто-то действительно хочет злоупотреблять асимптотической теорией, он может (но не должен ...) принять ноль в вашем примере: стандартной асимптотической ошибкой является . Таким образом, ваш асимптотический доверительный интервал будет равен (0,0), и все это относится к нулевой гипотезе. Но это просто злоупотребление асимптотическими результатами; обратите внимание, что вы получите тот же вывод, даже если = 1.п(p^(1−p^)/n)−−−−−−−−−−√=0 n
источник
Я знаю, что вы имеете дело с нулевой гипотезой, но настоящей проблемой является приведенный пример или, как указано, Простой пример. 1000 человек получают наркотик, и он не работает. Какие еще болезни были у этих людей, каков был их возраст и стадии заболевания? Чтобы объявить нулевую гипотезу больше информации; вероятно, подробно; должно быть дано, чтобы сделать эту работу в научной среде.
источник