Понимание критерия хи-квадрат и распределения хи-квадрат

13

Я пытаюсь понять логику теста хи-квадрат.

Критерий хи-квадрат равен . Затем сравнивается с распределением хи-квадрат, чтобы определить значение p., чтобы отклонить или не принять нулевую гипотезу. : наблюдения получены из распределения, которое мы использовали для создания наших ожидаемых значений. Например, мы могли бы проверить, дается ли вероятность получения как мы ожидаем. Таким образом, мы переворачиваем 100 раз и находим и . Мы хотим сравнить наш результат с ожидаемым ( ). Мы могли бы также использовать биномиальное распределение, но дело не в этом… Вопрос в следующем: χ2H0pnH1-nH100pχ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

Не могли бы вы объяснить, почему, согласно нулевой гипотезе, следует распределению хи-квадрат?(obsexp)2exp

Все, что я знаю о распределении хи-квадрат, это то, что распределение хи-квадрат степени является суммой стандартного нормального распределения квадрате.кkk

Remi.b
источник
2
Это не так: это приближение. (Много) больше об этом появляется в теме на stats.stackexchange.com/questions/16921/… .
whuber
Это может оказаться интересным для Карла Пирсона и критерия хи-квадрат, (Placket, 1983) {pdf}
Авраам
Связанный с этим вопрос о том, почему хи-квадрат распределение используется для СОГЛАСИИ испытаний, хотя и не совсем дубликат: stats.stackexchange.com/questions/125312/...
Silverfish

Ответы:

12

Мы могли бы также использовать биномиальное распределение, но дело не в этом ...

Тем не менее, это наша отправная точка даже для вашего актуального вопроса. Я расскажу об этом несколько неформально.

Давайте рассмотрим с биномиальным случаем более широко:

YBin(n,p)

Предположим, что и таковы, что хорошо аппроксимируется нормалью с тем же средним и дисперсией (некоторые типичные требования: не мало, или что не маленький).npYmin(np,n(1p))np(1p)

Тогда будет примерно . Здесь - количество успехов.(YE(Y))2/Var(Y)χ12Y

Мы имеем и .E(Y)=npVar(Y)=np(1p)

(В тестовом случае известно, а указано в . Мы не делаем никакой оценки.)npH0

Так что будет примерно .(Ynp)2/np(1p)χ12

Обратите внимание, что . Также обратите внимание, что .(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

Следовательно,(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Что является просто статистикой хи-квадрат для биномиального случая.

Таким образом, в этом случае статистика хи-квадрат должна иметь распределение квадрата (приблизительно) стандартно-нормальной случайной величины.

Glen_b - Восстановить Монику
источник