Как работает тест Пиарсона «Чи-квадрат»

18

После недавнего отрицательного голосования я пытался проверить свое понимание теста Пирсона Чи в квадрате. Я обычно использую статистику хи-квадрат (или уменьшенную статистику хи-квадрат) для подгонки или проверки результирующей подгонки. В этом случае дисперсия обычно представляет собой не ожидаемое количество отсчетов в таблице или гистограмме, а некоторую экспериментально определенную дисперсию. В любом случае, у меня всегда было впечатление, что в тесте все еще используется асимптотическая нормальность полиномиального PDF (т.е. моя статистика теста

Q=(nNm)V1(nNm)

и асимптотически мультинормальна, где - ковариационная матрица). Следовательно, имеет распределение хи-квадрат при больших поэтому использование ожидаемого количества отсчетов в качестве знаменателя в статистике становится действительным для больших . Вполне возможно, что это верно только для гистограмм, я не анализировал небольшую таблицу данных в течение многих лет.(nNm)VQnn

Есть ли более тонкий аргумент, который я пропускаю? Мне было бы интересно получить ссылку или, еще лучше, краткое объяснение. (Хотя это возможно, я только что проголосовал за то, что пропустил слово «асимптотика», что, я признаю, довольно важно.)

котелок
источник
Исходя из этого, по-видимому, также верно, что можно использовать точно такой же тест с любыми нормально распределенными данными. Если бы я использовал вольтметр, который, как я знал, имел какую-то нормально распределенную ошибку, которую я определил, я мог бы использовать, . Это правда? Предполагается, что приведенная статистика хи-квадрат опирается на этот факт.
χ2=i(VobsVexp)2σ2
Боулер

Ответы:

1

Тест хи-квадрат предназначен для анализа категориальных данных. Это означает, что данные были подсчитаны и разделены на категории. Он не будет работать с параметрическими или непрерывными данными. Так что это не работает, чтобы определить результирующее соответствие в каждом случае.

Источник: http://www.ling.upenn.edu/~clight/chisquared.htm

BradHanks
источник
4
Добро пожаловать на этот сайт! Я не уверен, чтобы понять, как это относится к рассматриваемому вопросу. Не могли бы вы немного расширить этот ответ, имея в виду, что этот поток, вероятно, больше посвящен проверке соответствия, чем анализу двухсторонних таблиц сопряженности?
ХЛ
Возможно, я неправильно понял вопрос, но мне было интересно, подходит ли критерий хи-квадрат в этом примере. Я мог бы быть немного ржавым ...
BradHanks
1
χ2χ2