Почему ошибки типа II не особо подчеркиваются в статистической литературе?

Я видел много случаев, когда ошибки типа I учитываются (обозначаются как альфа-значение) в различных исследовательских статьях. Я редко обнаруживал, что исследователь принимает во внимание силу или ошибку типа II.

Ошибки типа II могут иметь большое значение, верно? Мы случайно отвергли альтернативную гипотезу, когда она фактически была ложной. Почему альфа-значения подчеркиваются так сильно, а не бета-значения?

Когда я брал статистику за первый год, меня никогда не учили бета - только альфа. Я чувствую, что к этим двум ошибкам следует относиться одинаково. Все же только альфа, кажется, подчеркнута.

hypothesis-testing type-i-and-ii-errors
источник

+1 Причина в том, что традиционно ошибка типа I (aka, или уровень значимости ) сначала исправляется, а затем тест строится так, чтобы минимизировать ошибку типа II (эквивалентно, например, чтобы максимизировать мощность) , Полезная статья в Википедии для понимания проблемы - статья о тестах Uniformly Most Powerful (UMP), en.wikipedia.org/wiki/Uniformly_most_powerful_test

α

$\alpha$

Jeremias K

Вы ошибаетесь по поводу того, что «мы приняли нулевую гипотезу» - мы никогда не принимаем ее. Мы либо «отклоняем нулевой гип», либо «не можем отклонить нулевой гип», но никогда не принимаем нулевой гип!

пещерный человек

взорвался - это скользнуло мимо меня. Спасибо что подметил это.

Будьте осторожны, чтобы не перепутать собственный опыт со всей областью статистической литературы; Вы вряд ли сможете определить содержание материала, который вы не читали.

Glen_b

@ Глин отлично. Умный заголовок получает больше откликов.

Ответы:

Это хороший вопрос. Позвольте мне начать с нескольких разъяснений:

На самом деле это ничего не значит для «ошибки [t] ype II [быть] значимой» (или для ошибки типа I). Конечно, может быть очень важно, чтобы мы пропустили истинный эффект, хотя.
Кроме того, мы обычно не «принимаем нулевую гипотезу». (Более подробно об этом можно прочитать в моем ответе: почему статистики говорят, что незначительный результат означает «вы не можете отвергнуть ноль», а не принять нулевую гипотезу? )

Я думаю, что вы (к сожалению) правы, что меньше внимания уделяется мощности и ошибкам типа II. Хотя я думаю, что ситуация в биомедицинских исследованиях улучшается (например, финансирующие агентства и IRB часто требуют анализа мощности сейчас), я думаю, что есть несколько причин для этого:

Я думаю, что людям труднее понять власть, чем простое значение. (Это отчасти потому, что это зависит от множества неизвестных, в частности, от величины эффекта, но есть и другие).
Большинство наук (т.е. кроме физики и химии) не очень хорошо математизированы. В результате, исследователям очень трудно понять, какой размер эффекта «должен» дать их теория (кроме просто ). $\ne0$
Ученые традиционно предполагали, что ошибки типа I хуже, чем ошибки типа II.

Gung - Восстановить Монику
источник

Как всегда, просвещение - особенно для нематематизированных :-) ... Мне нравится эта формулировка ... Интересно, не могли бы вы немного расширить третий пункт ... Есть ли основания для этого уклона. Я знаю, что это правда, но почему вы думаете, что это так ... Это потому, что речь идет о трофеях р-значения, и больше ничего не имеет значения?

Антони Пареллада

Спасибо @AntoniParellada. Я подумаю о том, что еще я мог бы добавить.

gung - Восстановить Монику

Я бы пояснил пункт 3) почему ученые считают, что ошибки типа I хуже. Нулевой гипотезой обычно является своего рода «статус-кво», например, эффект этого совершенно нового препарата равен 0. Нам нравится статус-кво, и бремя доказывания лежит на исследователе, чтобы доказать обратное. Таким образом, мы хотим ограничить ошибку типа I, т.е. мы ошибочно отвергаем статус-кво. ИМО, эта привязанность к статус-кво просто философская. Если вы хотите изменить мое мнение, вам придется это доказать.

Гейзенберг

На практике можно легко вспомнить случаи, когда ошибка типа II имеет гораздо большее значение, т. Е. Цена отказа от отклонения нуля высока. Например, если человечество столкнется с эпидемией зомби, я уверен, что отношение будет "попробуй любой наркотик, даже если он может не работать", а не "ты должен доказать, что он работает, прежде чем мы его используем".

Гейзенберг

Добавление к @Heisenberg: В случаях, когда ошибки типа II имеют наибольшее значение, следует рассмотреть возможность переключения между тестами точечной гипотезы и тестом эквивалентности. В вашем примере нужно было бы доказать, что предлагаемый вустерский соус, по крайней мере, не ухудшает эпидемию зомби. Затем коэффициенты ошибок меняют свою роль, и наиболее важный коэффициент ошибок снова фиксируется в проекте. Кроме того, если у вас есть некоторая оценка стоимости неправильных решений, следует рассмотреть правило принятия решений, которое минимизирует риск и не (обязательно) фиксирует частоту ошибок определенного типа I.

Хорст Грюнбуш

Причина в том, что мы просто не знаем фактическую частоту ошибок типа II и никогда не узнаем. Это зависит от параметра, который мы обычно не знаем. В свою очередь, если бы мы знали этот параметр, нам не нужно было бы делать статистический тест.

Тем не менее, мы можем спланировать эксперимент так, чтобы была достигнута определенная частота ошибок типа II, учитывая некоторую альтернативу. Таким образом, мы бы выбрали размер выборки, который не тратит ресурсы: либо потому, что тест не отклоняется в конце, либо потому, что уже гораздо меньшего размера выборки было бы достаточно, чтобы отклонить гипотезу.

Хорст Грюнбуш
источник