Во время учебы по курсу статистики я пытался понять разницу между односторонними и двусторонними проверками гипотез. В частности, почему односторонний тест отклоняет нулевое значение, а двусторонний - нет?
Пример:
hypothesis-testing
Лу Си
источник
источник
Ответы:
Двухсторонние тесты на разницу в любом направлении. Таким образом, значением P будет площадь под распределением t справа от t = 1,92 ПЛЮС площадь под распределением слева от t = -1,92. Это вдвое больше площади, чем односторонний тест, поэтому значение P в два раза больше.
Если вы используете односторонний тест, вы получаете силу, но за счет потенциальной стоимости необходимости игнорировать разницу, которая противоположна той, которая была предположена до получения данных. Если вы получили данные до того, как формализовали и записали гипотезу, вам действительно следует использовать двусторонний тест. Точно так же, если вы заинтересованы в эффекте в любом направлении, вы используете двухсторонний тест. На самом деле, вы можете использовать двусторонний тест в качестве подхода по умолчанию и использовать односторонний тест только в необычном случае, когда эффект может существовать только в одном направлении.
источник
Площадь под кривой не в два раза больше для двухстороннего теста: для двухстороннего теста с критическим p = 0,05 вы проверяете, как часто наблюдаемые данные могут быть получены из нижнего или верхнего 2,5% от нулевого распределения ( .05 всего). С помощью теста с 1 хвостом вы проверяете, как часто данные поступают из крайнего 5% хвоста одного (предварительно определенного) хвоста.
Частично ответ на ваш вопрос - один из практических: большинство исследователей считают эксперименты, сообщающие о 1-сторонних тестах, маловероятными для повторения (т. Е. Они предполагают, что исследователь выбрал это, чтобы сделать их статистику «значимой»).
Однако существуют допустимые варианты использования. Если вы знаете, что любой результат в обратном направлении невозможен в соответствии с тестируемой теорией, то, как отмечалось в предыдущем комментарии, вы можете указать это заранее и провести односторонний тест. Большинство людей, опять же, все еще смотрят на это осмотрительно.
источник
Это приводит к вопросу: зачем использовать разные тестовые статистические данные? Причина в том, что альтернативы разные, и поэтому мощность каждой тестовой статистики различна. В частности, мощность каждого теста уменьшается (при условии, что мы используем то же значение), если мы используем статистику теста и область отклонения от другого теста.
источник