Как указать нулевую гипотезу в проверке гипотез

15

Какое хорошее правило для того, как выбрать вопрос для нулевой гипотезы. Например, если я хочу проверить, верна ли гипотеза B, должен ли я использовать B в качестве нулевой, B в качестве альтернативной гипотезы или НЕ B в качестве нулевой? Я надеюсь, что вопрос ясен. Я знаю, что это как-то связано с ошибкой, которую я хочу минимизировать (Тип I?), Но я постоянно забываю, как это происходит, потому что у меня нет ясной интуиции, созданной для этого. Благодарю.

Нестор
источник
Ребята ... отличные отзывы. Все полезно. Меня по-прежнему удивляет, когда я получаю такой уровень сотрудничества в сети, просто потому, что людям это интересно. Вау, спасибо !
Нестор

Ответы:

17

Основное правило моего хорошего советника состояло в том, чтобы установить нулевую гипотезу на результат, который вы не хотите быть правдивым, то есть на результат, прямо противоположный тому, который вы хотите показать.

Базовый пример. Предположим, вы разработали новое медицинское лечение и хотите показать, что оно действительно лучше, чем плацебо. Таким образом, вы устанавливаете нулевую гипотезу новое лечение равно или хуже, чем плацебо, а альтернативная гипотеза H 1 : = новое лечение лучше, чем плацебо.H0:=ЧАС1знак равно

Это потому, что в ходе статистического теста вы либо отвергаете Нулевую Гипотезу (и поддерживаете Альтернативную Гипотезу), либо не можете ее отвергнуть. Поскольку ваша «цель» - отвергнуть Нулевую Гипотезу, вы поставили ее на тот результат, который не хотите быть правдой.

Дополнительное примечание: я знаю, что не следует настраивать статистический тест, чтобы его искажать и ломать, пока не будет отвергнута нулевая гипотеза; случайный язык использовался только для того, чтобы упростить это правило для запоминания.

Это также может быть полезно: что означает значения p и значения t в статистических тестах? и / или Что является хорошим введением в проверку статистических гипотез для компьютерщиков?

Штеффен
источник
6

Если гипотеза B является интересной гипотезой, вы можете принять not-B в качестве нулевой гипотезы и контролировать, при нулевом значении, вероятность ошибки типа I для ошибочного отклонения not-B на уровне . Отклонение not-B тогда интерпретируется как свидетельство в пользу B, потому что мы контролируем ошибку типа I, поэтому маловероятно, что not-B верен. Смущенный ... ? α

Возьмите пример лечения против отсутствия лечения в двух группах населения. Интересная гипотеза состоит в том, что лечение имеет эффект, то есть существует разница между обработанной группой и необработанной группой вследствие лечения. Нулевая гипотеза состоит в том, что нет никакой разницы, и мы контролируем вероятность ошибочного отклонения этой гипотезы. Таким образом, мы контролируем вероятность ошибочного заключения о том, что существует эффект лечения, когда нет эффекта лечения. Ошибка типа II - это вероятность ошибочного принятия нуля при наличии эффекта лечения.

Приведенная выше формулировка основана на структуре Неймана-Пирсона для статистического тестирования, где статистическое тестирование рассматривается как проблема решения между случаями, нулем и альтернативой. Уровень - это доля раз, когда мы делаем ошибку типа I, если мы (независимо) повторим тест. В этом контексте нет никакого формального различия между нулем и альтернативой. Если мы поменяем нуль и альтернативу, мы поменяем вероятность ошибок типа I и типа II. Мы, однако, не контролировали вероятность ошибки типа II выше (это зависит от того, насколько велик эффект лечения), и из-за этой асимметрии мы можем предпочесть сказать, что мы не можем отклонитьαнулевая гипотеза (вместо этого мы принимаем нулевую гипотезу). Таким образом, мы должны быть осторожны в заключении, что нулевая гипотеза верна только потому, что мы не можем отвергнуть ее.

ppppп-значение не должно быть обосновано (мнимым) повторным числом решений.

Ни одна структура не без проблем, и терминология часто путается. Я могу порекомендовать книгу « Статистические данные: парадигма правдоподобия » Ричарда М. Рояля для четкого рассмотрения различных концепций.

NRH
источник
5

«Частотный» ответ заключается в том, чтобы придумать нулевую гипотезу формы «не В», а затем выступить против «не В», как в ответе Штеффена. Это логический эквивалент аргументации «Ты неправ, поэтому я должен быть прав». Такого рода рассуждения используют политики (то есть другая сторона плохая, поэтому мы хорошие). При таком рассуждении довольно сложно иметь дело с более чем одной альтернативой. Это потому, что аргумент «ты неправ, поэтому я прав» имеет смысл только тогда, когда невозможно, чтобы оба были неправы, что, безусловно, может произойти, когда существует более одной альтернативной гипотезы.

«Байесовский» ответ заключается в простом вычислении вероятности гипотезы, которую вы хотите проверить, при условии наличия у вас доказательств. Всегда это содержит предварительную информацию, которая является просто предположениями, которые вы сделали, чтобы сделать вашу проблему правильно поставленной (все статистические процедуры основаны на предшествующей информации, байесовские процедуры просто делают их более явными). Он также обычно состоит из некоторых данных, и мы имеем теорему Байеса

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0это "альтернатива". Только коннотации, подразумеваемые словами «ноль» и «альтернатива», заставляют их казаться разными. Вы можете показать эквивалентность в случае «леммы Неймана Пирсона», когда есть две гипотезы, поскольку это просто отношение правдоподобия, которое дается сразу, принимая шансы вышеупомянутой теоремы Байеса:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

ЧАС0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1

probabilityislogic
источник
3
Этот первый абзац является пародией на классический подход к проверке гипотез.
whuber
Проверка гипотез не всегда является вопросом принятия решения. Это часто формулируется как таковое, но в науке вопрос может заключаться в том, чтобы задокументировать, что ноль является ложным и насколько. Я рассматриваю игру в слова как напоминание об этой цели. С этой точки зрения, отказ от отклонения - это не решение принять, а отсутствие доказательств в данных, которые необходимо отклонить.
NRH
@NRH - Я согласен, но это не всегда цель. Если вы хотите проверить новую теорию, вы хотите знать, насколько вероятно, что это правда, точно так же, как вы хотите знать, насколько вероятно, что это неверно. И хотя проверка гипотезы не всегда ведет непосредственно к решению, кажется, что потратить время на ее проверку не представляется возможным, если в конечном итоге это не приведет к решению. На самом деле вы уже формулируете решение в своем комментарии: «ведите себя так, как будто ноль ложен». Есть только одна альтернатива этому: «вести себя так, как если бы ноль был истинным». Если существует более одной альтернативы, то гипотеза ...
вероятностная
(продолжение) .. тест не был четко определен и, так сказать, «математически некорректен». В этом решении может быть большая неопределенность, но других альтернатив нет, ноль не может быть неверным и ложным одновременно, если только у вас нет некорректной / неоднозначной проблемы. Но в этом случае проверка гипотез не имеет смысла - не может быть правильного заключения.
вероятностная
(продолжая разглагольствование) - и если цель состоит в том, чтобы просто количественно оценить свидетельство против нуля, то вам не нужно проверять гипотезу. Это то, для чего р-значение - вам не нужно принимать или отклонять, просто сообщите его значение.
вероятностная
1

Нулевая гипотеза, как правило, должна предполагать, что различия в переменной отклика связаны только с ошибкой.

AxЧАС0Ax

Неспособность отклонить эту нулевую гипотезу будет интерпретироваться как:

1) любые различия xсвязаны с ошибкой, а не с Aили,

2) что данные не позволяют обнаружить разницу, даже если она существует (см. Ниже ошибку типа 2).

ЧАСaAx

ЧАС0AxЧАС0Ax

DQdlM
источник
1
Третий абзац, по- видимому, подразумевает, что отказ от отклонения нулевого значения означает, что нулевое значение является истинным, но очевидно, что это неверно: альтернатива может быть истинной (и, как правило, есть), но не достаточно отличается от нулевого, чтобы быть обнаруженным с данными данными.
whuber
@whuber - хороший вопрос, я отредактирую ответ, чтобы отразить это
DQdlM