Можем ли мы отклонить нулевую гипотезу с доверительными интервалами, полученными путем выборки, а не нулевой гипотезой?

9

Меня учили, что мы можем произвести оценку параметров в форме доверительного интервала после отбора проб из популяции. Например, 95-процентные доверительные интервалы, без каких-либо нарушенных допущений, должны иметь 95-процентную вероятность успеха, содержащую какой-либо истинный параметр, который мы оцениваем, в популяции.

То есть,

  1. Произведите точечную оценку из образца.
  2. Создайте диапазон значений, теоретически с вероятностью 95% содержащих истинное значение, которое мы пытаемся оценить.

Однако, когда тема превратилась в проверку гипотез, шаги были описаны следующим образом:

  1. Предположим некоторый параметр в качестве нулевой гипотезы.
  2. Произведите распределение вероятности получения различных точечных оценок, учитывая, что эта нулевая гипотеза верна.
  3. Откажитесь от нулевой гипотезы, если полученная нами точечная оценка будет получена менее чем в 5% случаев, если нулевая гипотеза верна.

У меня вопрос такой:

Нужно ли производить наши доверительные интервалы, используя нулевую гипотезу, чтобы отклонить нулевое значение? Почему бы просто не выполнить первую процедуру и получить нашу оценку истинного параметра (без явного использования нашего гипотетического значения при расчете доверительного интервала), а затем отвергнуть нулевую гипотезу, если она не попадает в этот интервал?

Это кажется логически эквивалентным для меня интуитивно, но я боюсь, что упускаю что-то очень фундаментальное, поскольку, вероятно, есть причина, по которой его учат таким образом.

Nikli
источник
Приношу свои извинения за неясность, Мартейн. Скоро я отредактирую свой пост, чтобы он был понятнее людям, которые ищут такие же вопросы в будущем. Я имел в виду, что мы можем рассчитать оценку параметра из выборки или рассчитать диапазон оценок, которые, как мы считаем, подтверждают нулевую гипотезу с использованием нулевой гипотезы. Я не понимал, почему было необходимо использовать нулевое значение, чтобы увидеть, находится ли наша точечная оценка в этом интервале, вместо того, чтобы просто использовать нашу оценку параметра и проверить, находится ли нулевое значение в пределах оценки параметра. Надеюсь это имеет смысл!
Никли
Интересный мысленный эксперимент, если кто-то пытается продать вам взвешенные кости. Они бросают их, затем утверждают, что они взвешены в том направлении, в котором вы наблюдаете (например, 6 появляется в 20% случаев). Взвешены ли они (достаточно ли было выполнено бросков образца), сколько и сколько стоит провести свои собственные (дополнительные) тесты броска костей? У продавца и покупателя разные цели ...
Филипп Окли

Ответы:

5

Простая проблема, в качестве примера, дается путем проверки среднего значения нормальной популяции с известной дисперсией . Тогда опорная точка - величина, распределение которой не зависит от параметра, задается как ˉ Y - μ N ( 0 , 1 / n ) . Критические значения z α / 2 удовлетворяют, в этом симметричном случае, Φ ( - z α / 2 ) = α / 2 и Φ ( z ασ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2.Φ(zα/2)=1α/2

1-αзнак равноPr{(Икс¯-μ)/(1/N)(-Zα/2,Zα/2)}знак равноPr{-Zα/2(Икс¯-μ)NZα/2}знак равноPr{Zα/2(μ-Икс¯)N-Zα/2}знак равноPr{-Zα/2/Nμ-Икс¯Zα/2/N}знак равноPr{Икс¯-Zα/2/NμИкс¯+Zα/2/N}знак равноPr{(Икс¯-Zα/2/N,Икс¯+Zα/2/N)μ}
(Икс¯-Zα/2/N,Икс¯+Zα/2/N)
1-α

В то же время, событие в первой строке дисплея точно также является событием, что нулевая гипотеза не отклоняется для этого . Поскольку остальное содержит только эквивалентные переформулировки, ci действительно содержит все для которых ноль не отклоняется, и ссылка на «под ноль» не требуется.μμ

Вот график, аналогичный визуализации Мартейна +1 с целью показать то, что известно как двойственность между доверительными интервалами и тестами. обозначает доверительный интервал, принадлежащий некоторым а - область принятия, принадлежащую некоторой гипотезе .СИкс¯*A(μ0)μзнак равноμ0

введите описание изображения здесь

Кристоф Ханк
источник
10

Да, вы можете заменить тест гипотезы (сравнивая выборку с гипотетическим распределением результатов теста) сравнением с доверительным интервалом, рассчитанным по выборке. Но косвенно доверительный интервал уже является своего рода проверкой гипотезы, а именно:

  • αα

α

пример

п(L(Икс)θ,U(Икс)θ)знак равно1-α

θИкс

доверительная вероятность

Обратите внимание, что:

  • θИкс

  • В горизонтальном направлении вы видите доверительные интервалы Клоппера-Пирсона. Если для любого данного наблюдения X вы используете эти доверительные интервалы, то вы будете ошибаться только в 5% случаев

    (потому что вы будете наблюдать только такой X, на котором вы основываете «неправильный» интервал, 5% времени)

Секст Эмпирик
источник