Традиционные статистические тесты, такие как t-критерий с двумя выборками, сосредоточены на попытке устранить гипотезу о том, что нет разницы между функцией двух независимых выборок. Затем мы выбираем уровень достоверности и говорим, что если разница средних значений превышает уровень 95%, мы можем отклонить нулевую гипотезу. Если нет, мы «не можем отвергнуть нулевую гипотезу». Кажется, это подразумевает, что мы тоже не можем принять это. Значит ли это, что мы не уверены, верна ли нулевая гипотеза?
Теперь я хочу разработать тест, в котором моя гипотеза состоит в том, что функция двух выборок одинакова (что является противоположностью традиционным статистическим тестам, где гипотеза состоит в том, что две выборки различны). Итак, моя нулевая гипотеза состоит в том, что два образца различны. Как мне разработать такой тест? Будет ли это так же просто, как сказать, что если значение p меньше 5%, мы можем принять гипотезу о том, что нет существенной разницы?
Ответы:
Традиционно нулевая гипотеза является балльной величиной. (Обычно это , но на самом деле это может быть любое значение точки.) Альтернативная гипотеза состоит в том, что истинным значением является любое значение, отличное от нулевого значения . Поскольку непрерывная переменная (например, средняя разница) может принимать значение, которое бесконечно близко к нулевому значению, но все еще не совсем равно, и, таким образом, делает нулевую гипотезу ложной, традиционная точечная нулевая гипотеза не может быть доказана.0
Представьте, что ваша нулевая гипотеза равна , а средняя разница, которую вы наблюдаете, равна . Разумно ли предположить, что нулевая гипотеза верна? Вы еще не знаете; было бы полезно узнать, как выглядит наш доверительный интервал . Скажем, ваш 95% доверительный интервал . Теперь мы должны сделать вывод, что истинное значение равно ? Мне было бы неудобно говорить, что, поскольку CI очень широк, и есть много больших ненулевых значений, которые, как мы можем разумно подозревать, согласуются с нашими данными. Допустим, мы собрали намного больше данных, и теперь наша наблюдаемая средняя разница составляет , но 95% -й ДИ равен0 0.01 (−4.99, 5.01) 0 0.01 (0.005, 0.015) , Наблюдаемая средняя разница осталась прежней (что было бы удивительно, если бы это действительно произошло), но доверительный интервал теперь исключает нулевое значение. Конечно, это всего лишь мысленный эксперимент, но он должен прояснить основные идеи. Мы никогда не сможем доказать, что истинное значение - это какое-то конкретное значение; мы можем только (возможно) опровергнуть, что это какое-то значение балла. В тестировании статистических гипотез тот факт, что значение p> 0,05 (и что 95% -й ДИ включает ноль) означает, что мы не уверены, верна ли нулевая гипотеза .
Что касается вашего конкретного случая, вы не можете построить тест, в котором альтернативная гипотеза состоит в том, что средняя разница равна а нулевая гипотеза - это что-то отличное от нуля. Это нарушает логику проверки гипотез. Вполне разумно, что это ваша основная научная гипотеза, но она не может быть вашей альтернативной гипотезой в ситуации проверки гипотез.0
Так что ты можешь сделать? В этой ситуации вы используете тестирование на эквивалентность. (Возможно, вы захотите прочитать некоторые из наших тем по этой теме, щелкнув тег эквивалентности .) Типичная стратегия заключается в использовании подхода двухсторонних тестов. Очень кратко, вы выбираете интервал, в пределах которого вы бы посчитали, что истинная средняя разница также может быть0 Если вам все равно, то вы выполняете односторонний тест, чтобы определить, меньше ли наблюдаемое значение, чем верхняя граница этого интервала, и еще один односторонний тест, чтобы определить, превышает ли он нижнюю границу. Если оба эти теста являются значимыми, то вы отвергли гипотезу о том, что истинное значение находится вне интервала, о котором вы заботитесь. Если один (или оба) несущественны, вы не можете отклонить гипотезу о том, что истинное значение находится за пределами интервала.
Например, предположим, что что-то в пределах интервала настолько близко к нулю, что вы думаете, что оно по существу совпадает с нулем для ваших целей, поэтому вы используете это в качестве своей основной гипотезы. Теперь представьте, что вы получите первый результат, описанный выше. Хотя попадает в этот интервал, вы не сможете отклонить нулевую гипотезу ни в одном одностороннем t-тесте, поэтому вы не сможете отклонить нулевую гипотезу. С другой стороны, представьте, что вы получили второй результат, описанный выше. Теперь вы обнаружите, что наблюдаемое значение попадает в обозначенный интервал, и может быть показано, что оно одновременно меньше верхней границы и больше нижней границы, поэтому вы можете отклонить нулевое значение. (Стоит отметить, что вы можете отклонить как(−0.02, 0.02) 0.01 гипотеза о том, что истинное значение равно , и гипотеза о том, что истинное значение лежит за пределами интервала , что на первый взгляд может показаться странным, но полностью соответствует логике проверки гипотез.) 0 (−0.02, 0.02)
источник
Рассмотрим случай, когда нулевая гипотеза состоит в том, что на монете 2 головы, т.е. вероятность головок равна 1. Теперь данные - это результат подбрасывания монеты один раз и видения голов. Это приводит к p-значению 1,0, которое больше, чем у любой разумной альфа. Значит ли это, что монета двуглавая? это может быть, но это также может быть честная монета, и мы случайно увидели головы (это случится в 50% случаев с честной монетой). Таким образом, высокое значение p в этом случае говорит о том, что наблюдаемые данные полностью согласуются с нулем, но это также согласуется с другими возможностями.
Точно так же, как приговор «Не виновен» в суде может означать, что обвиняемый невиновен, это также может быть связано с тем, что обвиняемый виновен, но доказательств недостаточно. То же самое с нулевой гипотезой, которую мы не можем отвергнуть, потому что нулевое значение может быть истинным, или же у нас может не быть достаточно доказательств, чтобы отвергнуть, даже если оно ложное.
источник
Отсутствие доказательств не является доказательством отсутствия (название статьи Альтмана Бланда о BMJ). Р-значения дают нам доказательство отсутствия, только когда мы считаем их значительными. В противном случае они ничего не говорят нам. Отсюда и отсутствие доказательств. Другими словами: мы не знаем, и может помочь больше данных.
источник
Нулевая гипотеза, , обычно принимается за то, что у вас есть основания предполагать. Часто это «текущее состояние знаний», которое вы хотите показать, статистически маловероятно.H0
Обычная установка для проверки гипотез - минимизировать ошибку типа I , то есть минимизировать вероятность того, что мы отвергнем нулевую гипотезу в пользу альтернативной даже если верна. Это ошибка, которую мы решили сначала минимизировать, потому что мы не хотим опровергать общие знания, когда эти общие знания действительно верны.H 0H1 H0
Вы должны всегда проектировать свой тест, помня, что должен быть тем, что вы ожидаете.H0
Если у нас есть две выборки, которые мы ожидаем одинаково распределить, то наша нулевая гипотеза состоит в том, что выборки одинаковы. Если у нас есть две выборки, которые, как мы ожидаем, будут (дико) разными, наша нулевая гипотеза состоит в том, что они разные.
источник