Альтернативы для критерия хи-квадрат на независимость для таблиц более 2 х 2

9

Каковы некоторые альтернативы критерию хи-квадрат для категориальных переменных с таблицами больше 2 x 2 и ячейками с числом меньше 5, если я не хочу объединять классы?

Израиль
источник
2
Тест хи-квадрат также можно использовать с большими столами, чем 2x2. Не могли бы вы объяснить, почему критерий хи-квадрат не подходит для вашей проблемы? Кроме того, не могли бы вы заявить о проблеме, которую вы надеетесь решить?
COOLSerdash
У меня есть таблица непредвиденных обстоятельств 2 x 3, и количество ячеек меньше 5
Израиль,
2
Спасибо, пожалуйста, отредактируйте свой вопрос и добавьте эту информацию, так как не все читают комментарии. Обычное эмпирическое правило в отношении критерия хи-квадрат заключается в том, что его результаты могут быть неточными, если ожидаемое количество клеток меньше 5. Обычно в этих случаях рекомендуется критерий Фишера . Тест Барнарда также может быть вариантом.
COOLSerdash

Ответы:

15

Здесь есть некоторые распространенные недоразумения. Тест хи-квадрат идеально подходит для таблиц, размер которых превышает . Для того чтобы фактическое распределение статистики теста хи-квадрат приблизилось к распределению хи-квадрат, традиционная рекомендация состоит в том, чтобы все ячейки имели ожидаемые значения . Здесь необходимо отметить две вещи: 52×25

  1. Неважно, каковы наблюдаемые числа клеток - они вполне могут быть без проблем - важны только ожидаемые числа . 0

  2. Известно, что это традиционное правило слишком консервативно. Может быть хорошо иметь ячеек с ожидаемым количеством если нет ожидаемого числа . Видеть: < 5 < 120%<5<1

Если ожидаемые значения не соответствуют этому более точному критерию, есть несколько альтернативных вариантов:

  1. Лучше всего, вероятно, имитировать распределение выборки статистики теста или использовать тест перестановки. В R, например, вы можете просто установить chisq.test(..., simulate.p.value=TRUE). Другое программное обеспечение также должно сделать это возможным.

  2. Вы можете использовать альтернативный тест, такой как точный тест Фишера. Хотя точный тест Фишера часто рекомендуется в этой ситуации, стоит отметить, что он делает разные предположения и может не подходить. А именно, точный тест Фишера предполагает, что количество строк и столбцов было задано заранее, и может изменяться только расположение комбинаций столбцов х строк (см .: Учитывая мощь компьютеров в наши дни, есть ли повод для проведения теста хи-квадрат а не точный тест Фишера? ). Если вам не нравится это предположение, имитация хи-квадрат будет лучшим вариантом.

Gung - Восстановить Монику
источник