Мне известно о нескольких связанных с этим вопросах (например, терминология проверки гипотез, окружающая нуль , возможно ли доказать нулевую гипотезу? ), Но я не знаю окончательного ответа на мой вопрос ниже.
Предположим, что мы проверяем гипотезу о том, честна ли монета или нет. У нас есть две гипотезы:
Предположим, мы используем уровень значимости 5%, возможны два случая:
- Когда мы получаем данные и обнаруживаем, что значение p меньше 0,05, мы говорим: «При уровне значимости 5% мы отвергаем ».
- Значение p больше 0,05, тогда мы говорим: «При уровне значимости 5% мы не можем отклонить ».
Мой вопрос:
В случае 1 правильно ли говорить «мы принимаем »?
Интуитивно и из того, что я узнал в прошлом, я чувствую, что «принимать» что-либо в результате проверки гипотез всегда неправильно. С другой стороны, в этом случае, поскольку объединение на в охватывает все «пространство», «отклонение » и «принятие » выглядят для меня совершенно одинаково. С другой стороны, я также могу подумать о следующей идее, которая говорит, что неправильно говорить «мы принимаем »:
У нас есть достаточно веские доказательства, чтобы верить, что не соответствует действительности, но у нас может не быть достаточно веских доказательств, чтобы верить, что соответствует действительности Следовательно, «отклонение » не означает автоматически «принятие »H 1 H 0 H 1
Итак, каков правильный ответ?
"Reject the null hypothesis"
и"Fail to reject the null hypothesis"
. Кроме того, вы можете проверить идеи Карла Поппера ...Ответы:
ИМО (как таковой , не являющийся логиком или формально обученным статистиком ), не следует воспринимать этот язык слишком серьезно. Даже отклонение нуля, когда p <.001, не делает ноль ложным без сомнения. Какой вред в том, чтобы «принять» альтернативную гипотезу в таком же временном смысле? Это кажется мне более безопасной интерпретацией, чем «принятие нуля» в противоположном сценарии (т. Е. Большое, незначительное p ), потому что альтернативная гипотеза гораздо менее конкретна. Например, если задано , если p = 0,06, вероятность того, что в будущих исследованиях будет найден эффект, по крайней мере столь же отличный от нулевого *, все еще составляет 94%, поэтому примитеα=.05 Нуль не является умной ставкой, даже если нельзя отклонить ноль. И наоборот, если р = 0,04, можно отвергнуть ноль, что я всегда понимал как предпочтение альтернативы. Почему не "принимать"? Единственная причина, которую я вижу, это то, что кто-то может ошибаться, но то же самое относится и к отказу.
Альтернатива не особенно сильна, потому что, как вы говорите, она охватывает все «пространство». Чтобы отклонить нулевое значение, необходимо найти надежный эффект с обеих сторон нулевого значения, чтобы доверительный интервал не включал нулевое значение. Учитывая такой доверительный интервал (CI), альтернативная гипотеза верна: все значения в пределах не равны нулю. Альтернативная гипотеза также верна для значений вне CI, но более отличается от нуля, чем наиболее сильно отличающееся значение в CI (например, если , это не Это даже может быть проблемой для альтернативной гипотезы, если ). Если вы можете получить такой КИ, то опять же, что не следует принимать по этому поводу, не говоря уже об альтернативной гипотезе?P ( h e a d ) = .9CI95%=[.6,.8] P(head)=.9
Мог бы быть какой-то аргумент, о котором я не знаю, но я сомневаюсь, что меня убедят. Прагматически, возможно, не стоит писать, что вы принимаете альтернативу, если в ней участвуют рецензенты, потому что успех с ними (как и с людьми в целом) часто зависит от того, чтобы не бросать вызов ожиданиям нежелательными способами. В любом случае, не так уж много поставлено на карту, если вы не принимаете «принять» или «отклонить» слишком строго в качестве окончательной истины. Я думаю, что это более важная ошибка, чтобы избежать в любом случае.
Также важно помнить, что нуль может быть полезен, даже если он, вероятно, не соответствует действительности. В первом примере, который я упомянул, где p = .06, отказ от отклонения нулевого значения - это не то же самое, что сделать ставку на то, что это правда, но в основном это то же самое, что судить о его полезности с научной точки зрения. Отказ от него - это то же самое, что и оценка альтернативы как более полезной. Это кажется мне достаточно близким к «принятию», тем более что принять гипотезу не так уж много.
Кстати, это еще один аргумент для фокусировки на КЕ: если вы можете отклонить нуль с помощью Неймана-Пирсона стиле рассуждения, то это не имеет значения , сколько меньше , чем р является для отклонения нулевой. Это может иметь значение по соображениям Фишера, но если вы можете отклонить нуль на уровне который вам подходит, то может быть более полезным переносить этот вперед в CI, а не просто отклонять нуль более уверенно, чем вы. нужно (своего рода статистический "перебор"). Если у вас заранее есть удобный коэффициент ошибок , попробуйте использовать этот коэффициент ошибок, чтобы описать, как вы думаете, размер эффекта может быть в пределахα α α C I ( 1 - α )α α α α CI(1−α) , Это, вероятно, более полезно, чем принятие более расплывчатой альтернативной гипотезы для большинства целей.
* Другим важным моментом в интерпретации значения этого примера p является то, что он представляет этот шанс для сценария, в котором задано, что значение NULL равно true. Если нулевое значение не соответствует действительности, как могут свидетельствовать доказательства в этом случае (хотя и недостаточно убедительно для общепринятых научных стандартов), тогда этот шанс еще больше. Другими словами, даже если нулевое значение истинно (но об этом никто не знает), было бы неразумно делать ставки в этом случае, и ставка еще хуже, если она не соответствует действительности!
источник
Предполагая, что, бросив монету несколько раз, вы получите последовательность
(head, tail, head, head, head)
То, что вы действительно рассчитываете с проверкой гипотезы на самом деле
ℙ[ obtaining (head, tail, head, head, head) | ℙ(head) = 0.5 ]
То есть вы получите ответ на следующий вопрос:
Предполагая
H0: ℙ(head) = 0.5
, я получаю последовательность(head, tail, head, head, head)
по крайней мере 5% времени?Таким образом, вопрос сформулирован таким образом, что вы просто не можете получить ответ, сформулированный в
1. Is ℙ(head) ≠ 0.5 true
?Оба утверждения не являются взаимоисключающими. Не потому, что одно утверждение неверно, другое обязательно верно.
Таким образом, в случае 1,
is it correct to say "we accept H1"?
ответ «нет», и ваш вывод:кажется правильным для меня.
Научные теории строятся только на определенном наборе утверждений, пока одно из них не окажется неверным. В соответствии с этим общая идея проверки гипотез состоит в том, чтобы исключить непосредственное противоречие предложения с помощью общедоступных фактов, но оно не дает доказательства этого.
источник