Является ли р = 5,0% значимым?

14

Сегодня меня спросили, считается ли значение р 0,05 (точно) значимым (учитывая альфа = 5%) или нет. Я не знал ответа, и Google нашел оба ответа: (a) результат значим, если p меньше 5%, и (b) если p меньше 5% или равен 5%.

Конечно, ни один из этих сайтов никого не цитировал. Почему один - это общеизвестно, а 5% произвольно, во всяком случае. Но это не поможет мне рассказать ученикам что-то, что нужно запомнить.

Итак, вот мои отчаянные вопросы о проверке гипотез: если р-значение точно альфа - считаю ли результат значимым или нет? И что такое авторская цитата в этом случае?

большое спасибо

BurninLeo
источник

Ответы:

19

Оставив в стороне некоторые практические проблемы (например, степень , в которой α произвольности , например), определения уровня значимости и p-значения делают ответ на этот вопрос однозначным.

То есть формально правило отклонения таково, что вы отвергаете, когда .p=α

Это действительно должно иметь значение только для дискретного случая, но в этой ситуации, если вы не откажетесь, когда , частота ошибок вашего типа I на самом деле не будет α !p=αα

(Насколько мне известно, здесь нет «авторитетной» ссылки; вам действительно нужно разобраться с подходами Неймана-Пирсона и Фишериана к проверке гипотез, и это то, что развивалось с течением времени.)

Существует множество хороших статистических текстов, которые правильно описывают проверку гипотез.

Определение значения p дано правильно в первом предложении соответствующей статьи Википедии. *:

p-значение - это вероятность получения тестовой статистики, по крайней мере, такой же экстремальной, как и та, которая фактически наблюдалась, при условии, что нулевая гипотеза верна.

* (и нет, википедия не авторитет, я просто говорю, что это определение правильно)

Для простоты давайте придерживаться нулевых точек; он служит для того, чтобы объяснить суть без дополнительных проблем.

αp α фактически возможно **. (Также обычно бывает, что фактическая альфа будет отличаться от чего-то хорошего и круглого, например 5%.)

** Ну, я полагаю, что я ограничиваю свое обсуждение только чисто дискретной или чисто непрерывно распределенной тестовой статистикой. В смешанном случае вы можете выяснить, как применимо мое дискретное обсуждение (в ситуациях, когда это применимо).

n=17α=4.904%137500217

H0p=αα

H0p=αα

p=α

p=α

Если вы опишите свое правило отказа и покажете, что (если предположения выполнены), оно имеет желаемый уровень значимости, то, вероятно, в ссылках нет необходимости.

H0

α

(Если у вас другое издание, номера страниц могут измениться, но у него есть индекс, так что вы можете искать термины; будьте осторожны, вам может понадобиться просмотреть списки в разделе «Проверка гипотез» или что-то подобное в индексе, чтобы найти «регион отказа»)

Хм, давайте попробуем еще одну книгу с полки. Wackerly, Mendenhall & Scheaffer Математическая статистика с приложениями, 5-е издание , определяет область отклонения на p412 и значение p (такое же определение, как C & B) на p431.

Glen_b - Восстановить Монику
источник
Спасибо. Пожалуйста, позвольте мне глупый вопрос «практического пользователя статистики»: где, кроме Википедии, я найду это определение и / или правило отказа, на которое вы ссылаетесь? Я просмотрел некоторые статистические книги, но не нашел отрывок. Вероятно, поиск неправильных слов ...
BurninLeo
см. обновления, чтобы ответить
Glen_b
Ты замечательный! Конечно, вы знали это, но иногда все равно стоит заявить. Большое спасибо!
BurninLeo
1
(+1) Действительно хороший ответ.
ХЛ
2

Интересное признание, которое я узнал в своем раннем уроке биостатистики от профессора, заключается в том, что уровень значимости 0,05 был достигнут скорее благодаря консенсусу, чем по золотой истине. С тех пор я видел литературу, которая заигрывает с уровнем значимости 0,05, например, «приближение» все еще является поразительным открытием исследования, и я слышал аргументы о том, что уровень значимости 0,05 не может применяться ко всем областям исследования. С учетом сказанного я обнаружил, что точечные оценки и доверительные интервалы более информативны, чем уровни значимости. Вот интересная статья по этому вопросу (для меня в любом случае).

user2300643
источник
Спасибо за ссылку @ user2300643. И спасибо, что избежали финансового барьера для доступа!
номера 12
Там интересная дискуссия о происхождении 5% уровня значимости и т.д. здесь .
Glen_b
0

Значение p обычно устанавливается для консенсуса, как сказано ранее (или, скорее, лень). Чтобы действительно сказать, что что-то является значимым, мы должны найти значение p, которое соответствует размеру эффекта, размеру выборки и насколько строгим оно должно быть для ваших данных. Это называется анализом мощности (это подполе статистики). Многие люди либо не знают, либо просто не используют его, потому что это не так просто. Это не значит, что все в порядке. Мы всегда должны проводить такого рода исследования, чтобы сделать действительно важные выводы.

raygozag
источник