Два определения p-значения: как доказать их эквивалентность?

Я читаю книгу Ларри Вассермана « Вся статистика» и в настоящее время рассказываю о p-значениях (стр. 187). Позвольте мне сначала ввести некоторые определения (я цитирую):

Определение 1 Степенная функция теста с областью отклонения определяется как Размер теста определяется как тест имеет уровень если его размер меньше или равен . $R$
$β (θ) = P_{θ} (X \in R)$ $\beta(\theta)=P_{\theta}(X\in R)$ $α = sup_{θ \in Θ_{0}} β (θ)$ $\alpha = \sup_{\theta\in\Theta_0}\beta(\theta)$ $\alpha$ $\alpha$

Это в основном говорит о том, что $\alpha$ , размер является «самой большой» вероятностью ошибки типа I. Затем значение $p$ определяется через (я цитирую)

Определение 2 Предположим, что для каждого $\alpha\in(0,1)$ у нас есть тест размера $\alpha$ с областью отклонения $R_\alpha$ . Затем
$p -value = inf {α : T (X^{n}) \in R_{α}}$ $p\text{-value}=\inf\{\alpha:T(X^n)\in R_\alpha\}$ где $X^n=(X_1,\dots,X_n)$ .

Для меня это означает: для заданного $\alpha$ есть область тестирования и отклонения $R_\alpha$ так что $\alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha)$ . Для $p$ значения я просто беру наименьшее из всех этих $\alpha$ .

Вопрос 1 Если бы это было так, то я мог бы четко выбрать $\alpha = \epsilon$ для сколь угодно малого $\epsilon$ . Какова моя неправильная интерпретация определения 2, то есть что именно оно означает?

Теперь Вассерман непрерывен и формулирует теорему, чтобы иметь «эквивалентное» определение $p$ значения, с которым я знаком (я цитирую):

Теорема Предположим, что размер test имеет вид Тогда где - наблюдаемое значение . $\alpha$
$reject H_{0} ⟺ T (X^{n}) \geq c_{α}$ $\text{reject } H_0 \iff T(X^n)\ge c_\alpha$ $p -value = sup_{θ \in Θ_{0}} P_{θ} (T (X^{n}) \geq T (x^{n}))$ $p\text{-value} = \sup_{\theta\in\Theta_0}P_{\theta}(T(X^n)\ge T(x^n))$ $x^n$ $X^n$

Итак, вот мой второй вопрос:

Вопрос 2 Как я могу доказать эту теорему? Может быть, это из-за моего неправильного понимания определения значения, но я не могу понять это. $p$

hypothesis-testing mathematical-statistics p-value математический
источник

Позитивно странно, что Вассерман определит мощность как " ", поскольку символ почти повсеместно используется для частоты ошибок типа II (то есть power = 1- для почти любого другого автора, обсуждающего мощность). Я затрудняюсь представить себе вариант обозначения, способного породить еще большее замешательство, кроме как намеренно излагать его.

β

$\beta$

β

$\beta$

β

$\beta$

Glen_b

Я согласен, что это странно, Глен - однако Казелла и Бергер делают одно и то же, и их текст, на мой взгляд, является золотым стандартом статистической теории.

Мэтт Бремс

Ответы:

У нас есть несколько многомерных данных , взятых из дистрибутива с неизвестным параметром . Обратите внимание, что являются примерами результатов. $x$ $\mathcal{D}$ $\theta$ $x$

Мы хотим проверить некоторую гипотезу о неизвестном параметре , значения при нулевой гипотезе находятся в наборе . $\theta$ $\theta$ $\theta_0$

В пространстве мы можем определить область отклонения , и тогда мощность этой области определяется как . Таким образом, мощность вычисляется для конкретного значения из , как вероятность того, что образец исход находится в области режекции , когда значение есть . Очевидно, что мощность зависит от региона и от выбранного . $X$ $R$ $R$ $\mathcal{P}_\bar{\theta}^R=P_\bar{\theta}(x \in R)$ $\bar{\theta}$ $\theta$ $x$ $R$ $\theta$ $\bar{\theta}$ $R$ $\bar{\theta}$

Определение 1 определяет размер области $R$ как супремум всех значений для в , поэтому только для значений под . Очевидно , что это зависит от региона, так . $\mathcal{P}_\bar{\theta}^R$ $\bar{\theta}$ $\theta_0$ $\bar{\theta}$ $H_0$ $\alpha^R=sup_{\bar{\theta} \in \theta_0} \mathcal{P}_\bar{\theta}^R$

Поскольку зависит от у нас есть другое значение при изменении области, и это является основой для определения значения p: измените область, но таким образом, чтобы наблюдаемое значение выборки все еще принадлежало области, для каждая такая область, вычислить , как определено выше , и нижняя грань берется: . Таким образом, значение p является наименьшим размером из всех областей, которые содержат . $\alpha^R$ $R$ $\alpha_R$ $pv(x)=inf_{R |_{x \in R}} \alpha^R$ $x$

Тогда эта теорема является просто «переводом» ее, а именно, в случае, когда области определяются с использованием статистики а для значения вы определяете область как . Если вы используете этот тип области в рассуждениях выше, то теорема следующая. $R$ $T$ $c$ $R$ $R=\{ x | T(x) \ge c \}$ $R$

РЕДАКТИРОВАТЬ из-за комментариев:

@ user8: для теоремы; если вы определяете области отклонения, как в теореме, то область отклонения размера - это набор, который выглядит как для некоторого . $\alpha$ $R^\alpha= \{X | T(X) \ge c_\alpha \}$ $c_\alpha$

Чтобы найти значение p наблюдаемого значения , то есть вы должны найти наименьшую область , то есть наибольшее значение такое что прежнему содержит , последнее (область содержит ) эквивалентно (из-за способа определения областей) тому, что , поэтому вы должны найти самый большой такой, что $x$ $pv(x)$ $R$ $c$ $\{X | T(X) \ge c \}$ $x$ $x$ $c \ge T(x)$ $c$ $\{X | T(X) \ge c \& c \ge T(x) \}$

Очевидно, что наибольшее такое, что должно быть и тогда множество supra становится $c$ $c \ge T(x)$ $c = T(x)$ $\{ X | T(X) \ge c = T(x)\}=\{ X | T(X) \ge T(x)\}$

источник

Большое спасибо за ваш ответ. На вопрос о проверке теоремы: нет ли какой-то пропущенной over ?

inf

$\inf$

α

$\alpha$

математика

@ user8: я добавил абзац в конце своего ответа, теперь вы видите точку с инфимумом?

В определении 2 значение тестовой статистики является наибольшей нижней границей всех , так что гипотеза отклоняется для теста размера . Напомним, что чем меньше мы делаем , тем меньше допускаем ошибку I типа, поэтому область отклонения также будет уменьшаться. Так что (очень) неформально говоря, значение - это наименьшее значение мы можем выбрать, которое все еще позволяет нам отклонять для данных, которые мы наблюдали. Мы не можем произвольно выбрать меньшую потому что в какой-то момент $p$ $\alpha$ $\alpha$ $\alpha$ $R_\alpha$ $p$ $\alpha$ $H_0$ $\alpha$ $R_\alpha$ будет настолько малым, что исключит (т.е. не сможет содержать) событие, которое мы наблюдали.

Теперь, в свете вышесказанного, я приглашаю вас пересмотреть теорему.

heropup
источник

Я все еще немного смущен. Итак, во-первых, в определении статистика фиксирована для всех ? Я не согласен с вашим утверждением: «... в какой-то момент будет настолько маленьким, что исключит (т.е. не сможет содержать) событие, которое мы наблюдали». Прекрасно, если настолько мала, что не содержит наблюдаемого образца, мы не отклоняем . В чем проблема с этим? спасибо за вашу помощь / терпение

2

$2$

T

$T$

α

$\alpha$

R_{α}

$R_\alpha$

R_{α}

$R_\alpha$

H_{0}

$H_0$

математика

Да. Тестовая статистика является предопределенной фиксированной функцией выборки, где «фиксированная» в этом смысле означает, что форма функции не изменяется ни для какой . Значение, которое он принимает, может (и должно) зависеть от образца. Ваше утверждение «мы не отвергаем » показывает, почему ваше несогласие неверно: по определению , включает в себя набор всех значений, для которых статистика теста приводит к отклонению нулевого значения . Вот почему он обозначен как - для выброса "R". Я опубликую обновление моего ответа, чтобы объяснить более подробно.

T

$T$

α

$\alpha$

H_{0}

$H_0$

R_{α}

$R_\alpha$

R

$R$

heropup

Большое спасибо за ваш быстрый ответ и заранее за вашу обновленную версию. Я имел в виду следующее: мы отклоняем если , где - наблюдаемая выборка. Скажем, я очень экстремальный и выбираю очень маленьким, так что для данного образца что просто означает, что мы НЕ отклоняем . Так что маленькая не является априори плохой вещью. Ясно, что в какой-то момент он настолько мал, что очень и очень маловероятно, чтобы наблюдать образец, принадлежащий . Еще раз спасибо за ваше терпение / помощь. действительно ценится!

H_{0}

$H_0$

T (x_{n}) \in R_{α}

$T(x_n)\in R_\alpha$

x_{n}

$x_n$

R_{α}

$R_\alpha$

T (x_{n}) \notin R_{α}

$T(x_n)\notin R_\alpha$

H_{0}

$H_0$

R_{α}

$R_\alpha$

R_{α}

$R_\alpha$

математика

Данное определение значения р явно требует, чтобы тестовая статистика для образца находилась в области отклонения . Вы не можете изменить эту часть определения p-значения.

Glen_b

@Glen_b Спасибо за комментарий. Действительно, мой предыдущий комментарий действительно нарушает определение. Спасибо за указание на это.

математика