Вопрос новичка об остатке Пирсона в контексте теста хи-квадрат на соответствие формы:
Помимо статистики теста, chisq.test
функция R сообщает об остатке Пирсона:
(obs - exp) / sqrt(exp)
Я понимаю, почему смотреть на необработанную разницу между наблюдаемыми и ожидаемыми значениями не так информативно, так как меньшая выборка приведет к меньшей разнице. Однако я хотел бы узнать больше о влиянии знаменателя: зачем делить на корень ожидаемого значения? Это «стандартизированный» остаток?
chi-squared
goodness-of-fit
residuals
Йен Диллингем
источник
источник
stdres
для стандартизированных остатков.chisq.test
также вычисляетstdres
компонент?Ответы:
Стандартная статистическая модель, лежащая в основе анализа таблиц сопряженности, заключается в допущении, что (безоговорочно по общему количеству) число ячеек является независимой пуассоновской случайной величиной. Так что если у вас естьн × м таблица непредвиденных обстоятельств n × m , статистическая модель, используемая в качестве основы для анализа, учитывает, что у каждого количества ячеек есть безусловное распределение:
После того, как вы наложите общее количество ячеек для таблицы сопряженности или число строк или столбцов, результирующие условные распределения количества ячеек станут многочленными. В любом случае для распределения ПуассонаE ( Xя , дж) = V ( Xя , дж) = μя , дж , поэтому стандартизированное число ячеек равно:
Итак, в формуле, о которой вы спрашиваете, вы видите стандартизированное число ячеек в предположении, что число ячеек имеет (безусловное) распределение Пуассона.
Отсюда обычно тестируют независимость переменной строки и столбца в данных, и в этом случае вы можете использовать тестовую статистику, которая просматривает сумму квадратов вышеуказанных значений (что эквивалентно квадрату-норме вектора стандартизированных значений). Тест хи-квадрат предоставляет значение p для этого вида теста на основе приближения большой выборки к нулевому распределению статистики теста. Обычно применяется в случаях, когда ни один из показателей продаж не является слишком маленьким.
источник
В контексте хорошего соответствия вы можете обратиться к этому http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm .
Если вы хотите знать, как появился знаменатель, вам придется рассматривать хи-квадрат здесь как нормальное приближение к биному, для начала, которое затем можно распространить на многочлены.
источник