При формальном выводе доверительного интервала оценки я получил формулу, очень похожую на способ вычисления значения.
Таким образом, вопрос: формально они эквивалентны? Т.е. отвергает гипотезу с критическим значением эквивалентным не принадлежащему доверительному интервалу с критическим значением ?
hypothesis-testing
confidence-interval
p-value
Хорхе Лейтао
источник
источник
Ответы:
Да и нет.
Сначала "да"
Вы заметили, что когда тест и доверительный интервал основаны на одной и той же статистике, между ними существует эквивалентность: мы можем интерпретировать значение как наименьшее значение α, для которого нулевое значение параметра будет быть включены в 1 - α доверительный интервал.p α 1−α
Пусть - неизвестный параметр в пространстве параметров Θ ⊆ R , и пусть образец x = ( x 1 , … , x n ) ∈ X n ⊆ R n - реализация случайной величины X = ( X 1 , … , Х н ) . Для простоты определим доверительный интервал I α ( X ) как случайный интервал, так что его вероятность покрытия P θθ Θ⊆R x=(x1,…,xn)∈Xn⊆Rn X=(X1,…,Xn) Iα(X)
(Аналогичным образом можно рассмотреть более общие интервалы, где вероятность покрытия либо ограничена, либо приблизительно равна 1 - α
Рассмотрим двусторонний тест точечной нулевой гипотезы против альтернативной области отклонения H 1 представляет собой наборH0(θ0):θ=θ0 . Пусть λ ( θ 0 , x ) обозначает p-значение теста. Для любого альфа ∈ ( 0 , 1 ) , Н 0 ( θ 0 ) отклоняется на уровне & alpha ; еслиH1(θ0):θ≠θ0 λ(θ0,x) α∈(0,1) H0(θ0) α . Областьуровня α λ ( θ 0 , x ) ≤ α } .λ(θ0,x)≤α α которое приводит к отклонению H 0 ( θ 0 ) :
R α ( θ 0 ) = { x ∈ R n :x H0(θ0)
Теперь рассмотрим семейство двусторонних тестов с p-значениями для θ ∈ Θ . Для такого семейства мы можем определить инвертированную область отклонения Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ(θ,x) θ∈Θ
При любом фиксированном , Н 0 ( θ 0 ) отклоняется , если х ∈ R α ( θ 0 ) , что происходит тогда и только тогда , когда θ 0 ∈ Q α ( х ) , то есть х ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) . Если тест основан на тестовой статистике с полностью заданным абсолютно непрерывным нулевым распределением, тоθ0 H0(θ0) x∈Rα(θ0) θ0∈Qα(x)
(Многое из этого взято из моей кандидатской диссертации .)
Теперь для «нет»
Это явление связано с проблемами, связанными с тем, что такие интервалы не являются вложенными, а это означает, что интервал 94% может быть короче интервала 95%. Подробнее об этом см. Раздел 2.5 этой моей недавней статьи (появится в Бернулли).
И второе "нет"
И иногда "да" не очень хорошая вещь
Как указывает f Коппенс в комментарии, иногда интервалы и тесты имеют несколько противоречивые цели. Мы хотим короткие интервалы и тесты с высокой мощностью, но самый короткий интервал не всегда соответствует тесту с самой высокой мощностью. Некоторые примеры этого см. В этой статье (многомерное нормальное распределение), или в этом (экспоненциальное распределение), или в разделе 4 моей диссертации .
Байесовцы могут также сказать, да и нет
Несколько лет назад я разместил здесь вопрос о том, существует ли эквивалентность тестового интервала также в байесовской статистике. Короткий ответ: при стандартном тестировании байесовских гипотез ответом будет «нет». Немного переформулировав проблему тестирования, можно получить ответ «да». (Мои попытки ответить на мой собственный вопрос в конечном итоге превратились в бумагу !)
источник
источник