Я читаю книгу Ларри Вассермана « Вся статистика» и в настоящее время рассказываю о p-значениях (стр. 187). Позвольте мне сначала ввести некоторые определения (я цитирую):
Определение 1 Степенная функция теста с областью отклонения определяется как Размер теста определяется как тест имеет уровень \ alpha, если его размер меньше или равен \ alpha .
Это в основном говорит о том, что , размер является «самой большой» вероятностью ошибки типа I. Затем значение определяется через (я цитирую)
Определение 2 Предположим, что для каждого у нас есть тест размера с областью отклонения . Затем
где .
Для меня это означает: для заданного есть область тестирования и отклонения так что . Для значения я просто беру наименьшее из всех этих .
Вопрос 1 Если бы это было так, то я мог бы четко выбрать для сколь угодно малого . Какова моя неправильная интерпретация определения 2, то есть что именно оно означает?
Теперь Вассерман непрерывен и формулирует теорему, чтобы иметь «эквивалентное» определение значения, с которым я знаком (я цитирую):
Теорема Предположим, что размер test имеет вид Тогда где - наблюдаемое значение .
Итак, вот мой второй вопрос:
Вопрос 2 Как я могу доказать эту теорему? Может быть, это из-за моего неправильного понимания определения значения, но я не могу понять это.
источник
Ответы:
У нас есть несколько многомерных данных , взятых из дистрибутива с неизвестным параметром . Обратите внимание, что являются примерами результатов.x D θ x
Мы хотим проверить некоторую гипотезу о неизвестном параметре , значения при нулевой гипотезе находятся в наборе .θ θ θ0
В пространстве мы можем определить область отклонения , и тогда мощность этой области определяется как . Таким образом, мощность вычисляется для конкретного значения из , как вероятность того, что образец исход находится в области режекции , когда значение есть . Очевидно, что мощность зависит от региона и от выбранного .X R R PRθ¯=Pθ¯(x∈R) θ¯ θ x R θ θ¯ R θ¯
Определение 1 определяет размер областиR как супремум всех значений для в , поэтому только для значений под . Очевидно , что это зависит от региона, так .PRθ¯ θ¯ θ0 θ¯ H0 αR=supθ¯∈θ0PRθ¯
Поскольку зависит от у нас есть другое значение при изменении области, и это является основой для определения значения p: измените область, но таким образом, чтобы наблюдаемое значение выборки все еще принадлежало области, для каждая такая область, вычислить , как определено выше , и нижняя грань берется: . Таким образом, значение p является наименьшим размером из всех областей, которые содержат .αR R αR pv(x)=infR|x∈RαR x
Тогда эта теорема является просто «переводом» ее, а именно, в случае, когда области определяются с использованием статистики а для значения вы определяете область как . Если вы используете этот тип области в рассуждениях выше, то теорема следующая.R T c R R={x|T(x)≥c} R
РЕДАКТИРОВАТЬ из-за комментариев:
@ user8: для теоремы; если вы определяете области отклонения, как в теореме, то область отклонения размера - это набор, который выглядит как для некоторого .α Rα={X|T(X)≥cα} cα
Чтобы найти значение p наблюдаемого значения , то есть вы должны найти наименьшую область , то есть наибольшее значение такое что прежнему содержит , последнее (область содержит ) эквивалентно (из-за способа определения областей) тому, что , поэтому вы должны найти самый большой такой, чтоx pv(x) R c {X|T(X)≥c} x x c≥T(x) c {X|T(X)≥c&c≥T(x)}
Очевидно, что наибольшее такое, что должно быть и тогда множество supra становитсяc c≥T(x) c=T(x) {X|T(X)≥c=T(x)}={X|T(X)≥T(x)}
источник
В определении 2 значение тестовой статистики является наибольшей нижней границей всех , так что гипотеза отклоняется для теста размера . Напомним, что чем меньше мы делаем , тем меньше допускаем ошибку I типа, поэтому область отклонения также будет уменьшаться. Так что (очень) неформально говоря, значение - это наименьшее значение мы можем выбрать, которое все еще позволяет нам отклонять для данных, которые мы наблюдали. Мы не можем произвольно выбрать меньшую потому что в какой-то моментp α α α Rα p α H0 α Rα будет настолько малым, что исключит (т.е. не сможет содержать) событие, которое мы наблюдали.
Теперь, в свете вышесказанного, я приглашаю вас пересмотреть теорему.
источник