Какое хорошее правило для того, как выбрать вопрос для нулевой гипотезы. Например, если я хочу проверить, верна ли гипотеза B, должен ли я использовать B в качестве нулевой, B в качестве альтернативной гипотезы или НЕ B в качестве нулевой? Я надеюсь, что вопрос ясен. Я знаю, что это как-то связано с ошибкой, которую я хочу минимизировать (Тип I?), Но я постоянно забываю, как это происходит, потому что у меня нет ясной интуиции, созданной для этого. Благодарю.
hypothesis-testing
Нестор
источник
источник
Ответы:
Основное правило моего хорошего советника состояло в том, чтобы установить нулевую гипотезу на результат, который вы не хотите быть правдивым, то есть на результат, прямо противоположный тому, который вы хотите показать.
Базовый пример. Предположим, вы разработали новое медицинское лечение и хотите показать, что оно действительно лучше, чем плацебо. Таким образом, вы устанавливаете нулевую гипотезу новое лечение равно или хуже, чем плацебо, а альтернативная гипотеза H 1 : = новое лечение лучше, чем плацебо.H0:= ЧАС1: =
Это потому, что в ходе статистического теста вы либо отвергаете Нулевую Гипотезу (и поддерживаете Альтернативную Гипотезу), либо не можете ее отвергнуть. Поскольку ваша «цель» - отвергнуть Нулевую Гипотезу, вы поставили ее на тот результат, который не хотите быть правдой.
Дополнительное примечание: я знаю, что не следует настраивать статистический тест, чтобы его искажать и ломать, пока не будет отвергнута нулевая гипотеза; случайный язык использовался только для того, чтобы упростить это правило для запоминания.
Это также может быть полезно: что означает значения p и значения t в статистических тестах? и / или Что является хорошим введением в проверку статистических гипотез для компьютерщиков?
источник
Если гипотеза B является интересной гипотезой, вы можете принять not-B в качестве нулевой гипотезы и контролировать, при нулевом значении, вероятность ошибки типа I для ошибочного отклонения not-B на уровне . Отклонение not-B тогда интерпретируется как свидетельство в пользу B, потому что мы контролируем ошибку типа I, поэтому маловероятно, что not-B верен. Смущенный ... ?α
Возьмите пример лечения против отсутствия лечения в двух группах населения. Интересная гипотеза состоит в том, что лечение имеет эффект, то есть существует разница между обработанной группой и необработанной группой вследствие лечения. Нулевая гипотеза состоит в том, что нет никакой разницы, и мы контролируем вероятность ошибочного отклонения этой гипотезы. Таким образом, мы контролируем вероятность ошибочного заключения о том, что существует эффект лечения, когда нет эффекта лечения. Ошибка типа II - это вероятность ошибочного принятия нуля при наличии эффекта лечения.
Приведенная выше формулировка основана на структуре Неймана-Пирсона для статистического тестирования, где статистическое тестирование рассматривается как проблема решения между случаями, нулем и альтернативой. Уровень - это доля раз, когда мы делаем ошибку типа I, если мы (независимо) повторим тест. В этом контексте нет никакого формального различия между нулем и альтернативой. Если мы поменяем нуль и альтернативу, мы поменяем вероятность ошибок типа I и типа II. Мы, однако, не контролировали вероятность ошибки типа II выше (это зависит от того, насколько велик эффект лечения), и из-за этой асимметрии мы можем предпочесть сказать, что мы не можем отклонитьα нулевая гипотеза (вместо этого мы принимаем нулевую гипотезу). Таким образом, мы должны быть осторожны в заключении, что нулевая гипотеза верна только потому, что мы не можем отвергнуть ее.
Ни одна структура не без проблем, и терминология часто путается. Я могу порекомендовать книгу « Статистические данные: парадигма правдоподобия » Ричарда М. Рояля для четкого рассмотрения различных концепций.
источник
«Частотный» ответ заключается в том, чтобы придумать нулевую гипотезу формы «не В», а затем выступить против «не В», как в ответе Штеффена. Это логический эквивалент аргументации «Ты неправ, поэтому я должен быть прав». Такого рода рассуждения используют политики (то есть другая сторона плохая, поэтому мы хорошие). При таком рассуждении довольно сложно иметь дело с более чем одной альтернативой. Это потому, что аргумент «ты неправ, поэтому я прав» имеет смысл только тогда, когда невозможно, чтобы оба были неправы, что, безусловно, может произойти, когда существует более одной альтернативной гипотезы.
«Байесовский» ответ заключается в простом вычислении вероятности гипотезы, которую вы хотите проверить, при условии наличия у вас доказательств. Всегда это содержит предварительную информацию, которая является просто предположениями, которые вы сделали, чтобы сделать вашу проблему правильно поставленной (все статистические процедуры основаны на предшествующей информации, байесовские процедуры просто делают их более явными). Он также обычно состоит из некоторых данных, и мы имеем теорему Байеса
источник
Нулевая гипотеза, как правило, должна предполагать, что различия в переменной отклика связаны только с ошибкой.
A
x
A
x
Неспособность отклонить эту нулевую гипотезу будет интерпретироваться как:
1) любые различия
x
связаны с ошибкой, а не сA
или,2) что данные не позволяют обнаружить разницу, даже если она существует (см. Ниже ошибку типа 2).
A
x
A
x
A
x
источник