Должны ли нулевые и альтернативные гипотезы быть исчерпывающими или нет?

27

Я часто видел утверждения о том, что они должны быть исчерпывающими (примеры в таких книгах всегда приводились таким образом, что это действительно так), с другой стороны, я также видел много раз, когда книги заявляли, что они должны быть эксклюзивными ( например, как μ 1 = μ 2 и H 1 как μ 1 > μ 2 ), без выяснения исчерпывающего вопроса. Только перед тем, как вводить этот вопрос, я нашел несколько более сильное утверждение на странице Википедии - «Альтернативой не должно быть логическое отрицание нулевой гипотезы».H0μ1=μ2H1μ1>μ2

Может ли кто-нибудь более опытный объяснить, что это правда, и я был бы признателен за то, чтобы пролить некоторый свет на (исторические?) Причины такого различия (в конце концов, книги были написаны статистиками, то есть учеными, а не философами).

greenoldman
источник

Ответы:

14

В принципе, нет оснований для того, чтобы гипотезы были исчерпывающими. Если проверка касается параметра где H 0 является ограничением θ Θ 0 , альтернатива H a может иметь любую форму θ Θ a, если Θ 0Θ a = .θH0θΘ0HaθΘa

Θ0Θa=.

Пример того, почему исчерпывающая способность не имеет большого смысла, - это сравнение двух семейств моделей: и H a : x f 1 ( x | θ 1 ) . В таком случае исчерпаемость невозможна, поскольку альтернатива должна будет охватывать все возможные вероятностные модели.H0: xf0(x|θ0)Ha: xf1(x|θ1)

Сиань
источник
1
Спасибо, знаете ли вы случайно, почему так часто встречается требование быть исчерпывающим? Помимо простого недоразумения, потому что это было бы одним из самых распространенных недоразумений :-).
Гринольдман
3
Я не понимаю пример. Когда вы сравниваете два семейства моделей и H a между ними, кажется, исчерпываются все возможные модели в семействе. Если вы позволите пустому и альтернативному не покрыть каждую такую ​​модель, вы усложните процесс оценки теоретического риска теста (как в теории, так и на практике). H0Ha
whuber
2
@whuber: ты неправильно понял мой пример. Как написано выше, альтернатива состоит из четко определенного семейства моделей, где θ 1 охватывает весь набор возможных значений, а не из всех возможных вероятностных моделей. Поэтому это не является исчерпывающим. Это критика, высказанная против байесовского подхода к тестированию, см., Например, философа науки Дебору Майо в книге «Ошибки и умозаключения»Haθ1
Сиань,
2
Я думаю, что я правильно читаю ваш пример, Сиань, но, очевидно, я борюсь с тем, что вы подразумеваете под «исчерпывающим». Его использование в вашем ответе и комментариях, по-видимому, означает «включает в себя все вероятностные распределения», но в большинстве ситуаций проверки гипотез это не имеет значения. В данной ситуации «исчерпывающий» должен означать «включающий в себя все распределения, включенные в модель» (например, все нормальные распределения для теста нормальной теории).
whuber
15

Основная причина, по которой вы видите требование, чтобы гипотезы были исчерпывающими, заключается в том, что происходит, если истинное значение параметра находится в области, которая не охватывается ни нулевой, ни альтернативной гипотезой. Тогда тестирование на уровне достоверности становится бессмысленным, или, что еще хуже, ваш тест будет смещен в пользу нулевого значения - например, односторонний тест в форме θ = 0 против θ > 0 , когда на самом деле θαθзнак равно0θ>0 . θ<0

Пример: односторонний тест для против μ > 0 из нормального распределения с известным σ = 1 и истинным μ = - 0,1 . При размере выборки 100 тест 95% будет отклонен, если ˉ x > 0,1645 , но 0,1645 фактически на 2,645 стандартных отклонений выше истинного среднего значения, что приводит к фактическому уровню теста около 99,6%.μзнак равно0μ>0σзнак равно1μзнак равно-0,1Икс¯>0,1645

Кроме того, вы исключаете возможность удивления и изучения чего-то интересного.

Однако можно также рассматривать его как определение пространства параметров как подмножества того, что обычно можно считать пространством параметров, например, среднее нормальное распределение часто считается лежащим где-то на реальной линии, но если мы односторонний тест, мы, по сути, определяем пространство параметров как часть строки, охватываемую нулем и альтернативой.

jbowman
источник
Спасибо, вы допустили ошибку в формулировке, не исключительной, а исчерпывающей (первая строка).
Гринольдман
12
Концептуально односторонний тест - это действительно тест в форме ЧАС0:θ0 против ЧАСA:θ>0 скорее, чем ЧАС0:θзнак равно0 против ЧАСA:θ>0, В элементарных изложениях, особенно в Интернете, это различие затенено, но оно тщательно и правильно обрабатывается в статистической литературе и хороших учебниках. Таким образом, мы не ограничиваем пространство параметров.
whuber
2
whuber - вы правы насчет одностороннего теста, конечно. Я пытался, хотя и неумело, описать, что могло бы произойти, если бы гипотезы на самом деле не были исчерпывающими, что в этом случае произошло бы, если бы нулевые значения былиθзнак равно0, Если мы действительно хотим придерживаться нулевой точки и односторонней альтернативы и иметь исчерпывающие гипотезы, мне кажется, мы должны переопределить пространство параметров, как указано выше.
Jbowman
2
Действительно @whuber? Нулевая гипотеза в одностороннем тесте - это неравенство, которое включает непроверенный хвост? Это имеет гораздо больше смысла для меня! Но, как вы говорите, это было представлено в моем курсе как точка равенства. Благодарю за разъяснение.
Джеймс