Оставив в стороне некоторые практические проблемы (например, степень , в которой α произвольности , например), определения уровня значимости и p-значения делают ответ на этот вопрос однозначным.
То есть формально правило отклонения таково, что вы отвергаете, когда .p=α
Это действительно должно иметь значение только для дискретного случая, но в этой ситуации, если вы не откажетесь, когда , частота ошибок вашего типа I на самом деле не будет α !p=αα
(Насколько мне известно, здесь нет «авторитетной» ссылки; вам действительно нужно разобраться с подходами Неймана-Пирсона и Фишериана к проверке гипотез, и это то, что развивалось с течением времени.)
Существует множество хороших статистических текстов, которые правильно описывают проверку гипотез.
Определение значения p дано правильно в первом предложении соответствующей статьи Википедии. *:
p-значение - это вероятность получения тестовой статистики, по крайней мере, такой же экстремальной, как и та, которая фактически наблюдалась, при условии, что нулевая гипотеза верна.
* (и нет, википедия не авторитет, я просто говорю, что это определение правильно)
Для простоты давайте придерживаться нулевых точек; он служит для того, чтобы объяснить суть без дополнительных проблем.
αp α фактически возможно **. (Также обычно бывает, что фактическая альфа будет отличаться от чего-то хорошего и круглого, например 5%.)
** Ну, я полагаю, что я ограничиваю свое обсуждение только чисто дискретной или чисто непрерывно распределенной тестовой статистикой. В смешанном случае вы можете выяснить, как применимо мое дискретное обсуждение (в ситуациях, когда это применимо).
n=17α=4.904%137500217
H0p=αα
H0p=αα
p=α
p=α
Если вы опишите свое правило отказа и покажете, что (если предположения выполнены), оно имеет желаемый уровень значимости, то, вероятно, в ссылках нет необходимости.
H0
α
(Если у вас другое издание, номера страниц могут измениться, но у него есть индекс, так что вы можете искать термины; будьте осторожны, вам может понадобиться просмотреть списки в разделе «Проверка гипотез» или что-то подобное в индексе, чтобы найти «регион отказа»)
Хм, давайте попробуем еще одну книгу с полки. Wackerly, Mendenhall & Scheaffer Математическая статистика с приложениями, 5-е издание , определяет область отклонения на p412 и значение p (такое же определение, как C & B) на p431.
Интересное признание, которое я узнал в своем раннем уроке биостатистики от профессора, заключается в том, что уровень значимости 0,05 был достигнут скорее благодаря консенсусу, чем по золотой истине. С тех пор я видел литературу, которая заигрывает с уровнем значимости 0,05, например, «приближение» все еще является поразительным открытием исследования, и я слышал аргументы о том, что уровень значимости 0,05 не может применяться ко всем областям исследования. С учетом сказанного я обнаружил, что точечные оценки и доверительные интервалы более информативны, чем уровни значимости. Вот интересная статья по этому вопросу (для меня в любом случае).
источник
Значение p обычно устанавливается для консенсуса, как сказано ранее (или, скорее, лень). Чтобы действительно сказать, что что-то является значимым, мы должны найти значение p, которое соответствует размеру эффекта, размеру выборки и насколько строгим оно должно быть для ваших данных. Это называется анализом мощности (это подполе статистики). Многие люди либо не знают, либо просто не используют его, потому что это не так просто. Это не значит, что все в порядке. Мы всегда должны проводить такого рода исследования, чтобы сделать действительно важные выводы.
источник