Каковы «желательные» статистические свойства теста отношения правдоподобия?

11

Я читаю статью , метод которой полностью основан на тесте отношения правдоподобия. Автор говорит, что тест LR против односторонних альтернатив является UMP. Он продолжает, утверждая, что

«... даже если невозможно доказать, что [тест LR] является наиболее мощным, тест LR часто имеет желательные статистические свойства».

Мне интересно, что здесь означают статистические свойства. Учитывая, что автор ссылается на попутчиков, я предполагаю, что они общеизвестны среди статистиков.

Единственное желаемое свойство, которое мне удалось найти до сих пор, - это асимптотическое распределение хи-квадрат (при некоторых условиях регулярности), где - отношение LR.λ2logλλ

Я также был бы благодарен за ссылку на классический текст, где можно прочитать об этих желаемых свойствах.

Сергей Зыков
источник
Вы можете взглянуть на (главы 15 и 16) ван дер Ваарта: «Асимптотическая статистика».
kjetil b halvorsen

Ответы:

5

Было бы неплохо прочитать Что следует, если мы не сможем отвергнуть нулевую гипотезу? до объяснения ниже.

Желаемые свойства: мощность

В тестировании гипотез цель состоит в том, чтобы найти «статистические доказательства» для . Таким образом, мы можем делать ошибки типа I, то есть мы отклоняем (и решаем, что есть доказательства в пользу ), в то время как был истинным (то есть ложным). Таким образом, ошибка типа I - «поиск ложных доказательств» для .H 0 H 1 H 0 H 1 H 1H1H0H1H0H1H1

Ошибка типа II возникает, когда не может быть отклонено, хотя в действительности оно ложно, т. Е. Мы «принимаем » и «пропускаем» доказательства для .H 0 H 1H0H0H1

Вероятность ошибки типа I обозначается , выбранный уровень значимости. Вероятность ошибки типа II обозначается как а называется мощностью теста, это вероятность найти доказательства в пользу когда истинно.β 1 - β H 1 H 1αβ1βH1H1

В тестировании статистических гипотез ученый устанавливает верхний порог для вероятности ошибки типа I и в соответствии с этим ограничением пытается найти тест с максимальной мощностью, заданной .α

Желательные свойства тестов отношения правдоподобия связаны с мощностью

В тесте гипотезы против нулевая гипотеза и альтернативная гипотеза называются «простыми», то есть параметр фиксируется на одном значении, так же, как в как и в (точнее; распределения полностью определены). H 1 : θ = θ 1 H 0 H 1H0:θ=θ0H1:θ=θ1H0H1

Нейман-Пирсон лемма утверждает , что для проверки гипотез с простыми гипотезами, и для заданной вероятности ошибки типа I, тест отношения правдоподобия имеет самую высокую мощность. Очевидно, что высокая мощность, заданная является желательным свойством: мощность - это мера того, «насколько легко найти доказательства для ».H 1αH1

Когда гипотеза сложна; например, против тогда лемма Неймана-Пирсона не может быть применена, потому что в есть «множественные значения ». Если можно найти такой тест, чтобы он был наиболее мощным для каждого значения «ниже », то этот тест называется «равномерно наиболее мощным» (UMP) (т. Е. Наиболее мощным для каждого значения в ).H 1 : θ > θ 1 H 1 H 1 H 1H0:θ=θ1H1:θ>θ1H1H1H1

Есть теорема Карлина и Рубина, которая дает необходимые условия для того, чтобы критерий отношения правдоподобия был равномерно наиболее мощным. Эти условия выполняются для многих односторонних (одномерных) тестов.

Таким образом, желаемое свойство теста отношения правдоподобия заключается в том, что в нескольких случаях он имеет наибольшую мощность (хотя и не во всех случаях).

В большинстве случаев существование теста UMP не может быть показано, и во многих случаях (особенно многовариантном) может быть показано, что тест UMP не существует. Тем не менее, в некоторых из этих случаев тесты отношения правдоподобия применяются из-за их желательных свойств (в вышеприведенном контексте), потому что их относительно легко применять, а иногда потому, что другие тесты не могут быть определены.

Например, односторонним тестом, основанным на стандартном нормальном распределении, является UMP.

Интуиция позади теста отношения правдоподобия:

Если я хочу , чтобы тест против то необходимо наблюдение полученных из образца. Обратите внимание, что это одно значение. H 1 : θ = θ 1 oH0:θ=θ0H1:θ=θ1o

Мы знаем, что либо истинно, либо истинно, поэтому можно вычислить вероятность когда истинно (давайте назовем это ), а также вероятность наблюдения когда истинно (назовите это ).H 1 o H 0 L 0 o H 1 L 1H0H1oH0L0oH1L1

Если то мы склонны считать, что «вероятно истинно». Поэтому, если соотношение у нас есть основания полагать, что более реалистичен, чем . H 1 L 1L1>L0H1H1H0L1L0>1H1H0

Если будет примерно таким же, как то мы можем заключить, что это может быть случайно, поэтому для решения нам нужен тест и, следовательно, распределение которое является .. соотношение двух вероятностей. 1.001L1L1L01.001L1L0

Я нашел этот PDF в Интернете.

Сообщество
источник
1
Я думаю, что это пропускает вопрос ОП: цитата утверждает, что даже если невозможно доказать, что LRT является UMP, у него все еще есть другие привлекательные особенности. Так что же привлекательного в том, что это не UMP?
Клифф АВ
@Cliff AB: я думаю, что это есть в конце первого раздела, а второй раздел интуитивно объясняет, почему имеет смысл использовать LRT. Обратите внимание, что в большинстве случаев не существует UMP, и если нет «лучшего теста» или альтернативы, тогда, по-моему, не лишено смысла брать то, что «имеет смысл»? Но если у вас есть дополнительные элементы, то вам предлагается опубликовать их в своем собственном ответе. Это идея SE, я думаю.
Возможно, я просто читаю оригинальную цитату немного по-другому: я прочитал ее так: «У LRT есть и другие привлекательные функции, помимо просто силы».
Клифф AB
1
@CliffAB Я согласен с вашим комментарием, по-видимому, автор статьи, на которую я ссылался в своем вопросе, имел в виду, что LRT по какой-то причине хорош, даже если это не тест UMP, и я надеюсь, что эта причина не только в простоте реализации или отсутствие других альтернатив. Я подозреваю (надеюсь), что LRT обладает некоторыми хорошими асимптотическими свойствами (например, он непротиворечив, т.е. его мощность для любого становится если мы увеличиваем количество наблюдений). 1H11
Сергей Зыков
не стоит недооценивать простоту реализации!
Клифф AB