Я пытаюсь понять логику теста хи-квадрат.
Критерий хи-квадрат равен . Затем сравнивается с распределением хи-квадрат, чтобы определить значение p., чтобы отклонить или не принять нулевую гипотезу. : наблюдения получены из распределения, которое мы использовали для создания наших ожидаемых значений. Например, мы могли бы проверить, дается ли вероятность получения как мы ожидаем. Таким образом, мы переворачиваем 100 раз и находим и . Мы хотим сравнить наш результат с ожидаемым ( ). Мы могли бы также использовать биномиальное распределение, но дело не в этом… Вопрос в следующем: χ2H0pnH1-nH100⋅phead
Heads
tails
Не могли бы вы объяснить, почему, согласно нулевой гипотезе, следует распределению хи-квадрат?
Все, что я знаю о распределении хи-квадрат, это то, что распределение хи-квадрат степени является суммой стандартного нормального распределения квадрате.к
Ответы:
Тем не менее, это наша отправная точка даже для вашего актуального вопроса. Я расскажу об этом несколько неформально.
Давайте рассмотрим с биномиальным случаем более широко:
Предположим, что и таковы, что хорошо аппроксимируется нормалью с тем же средним и дисперсией (некоторые типичные требования: не мало, или что не маленький).n p Y min(np,n(1−p)) np(1−p)
Тогда будет примерно . Здесь - количество успехов.(Y−E(Y))2/Var(Y) ∼χ21 Y
Мы имеем и .E(Y)=np Var(Y)=np(1−p)
(В тестовом случае известно, а указано в . Мы не делаем никакой оценки.)n p H0
Так что будет примерно .(Y−np)2/np(1−p) ∼χ21
Обратите внимание, что . Также обратите внимание, что .(Y−np)2=[(n−Y)−n(1−p)]2 1p+11−p=1p(1−p)
Следовательно,(Y−np)2np(1−p)=(Y−np)2np+(Y−np)2n(1−p)=(Y−np)2np+[(n−Y)−n(1−p)]2n(1−p)=(OS−ES)2ES+(OF−EF)2EF
Что является просто статистикой хи-квадрат для биномиального случая.
Таким образом, в этом случае статистика хи-квадрат должна иметь распределение квадрата (приблизительно) стандартно-нормальной случайной величины.
источник