Применимость критерия хи-квадрат, если многие ячейки имеют частоты менее 5

13

Чтобы найти связь между поддержкой сверстников (независимая переменная) и удовлетворенностью работой (зависимая переменная), я хочу применить критерий хи-квадрат. Поддержка сверстников - это категории в четырех группах в зависимости от степени поддержки: 1 = очень меньшая степень, 2 = в некоторой степени, 3 = в значительной степени и 4 = в очень большой степени. Удовлетворенность работой делится на две категории: 0 = не удовлетворен и 1 = удовлетворен.

Выход SPSS говорит, что 37,5% частот ячеек меньше 5. Мой размер выборки 101, и я не хочу уменьшать категории в независимой переменной до меньшего числа. В этой ситуации есть ли другой тест, который можно применить для проверки этой ассоциации?

Braj-Stat
источник
1
Я не совсем уверен, как он обрабатывается в таблицах более высокого размера, как у вас, но в случае 2x2, небольшим примером аналога хи-квадрата является точный тест Фишера. Я слышал, что можно использовать FET в произвольных таблицах сопряженности rxc, но он требовал значительных вычислительных ресурсов. Другим вариантом будет сделать тест перестановки.
Кристофер Аден
3
Учитывая, что обе категории являются порядковыми, вы можете использовать тест, который использует это. См. Agresti, Анализ Порядковых Категориальных Данных для различных возможностей.
Питер Флом - Восстановить Монику
3
@Michael, потому что это не ответ: это просто подсказка, за которой следует (неопределенный) указатель на ответ в другом месте. Пожалуйста, смотрите SE FAQ об ответах .
whuber
4
Вы можете обсудить это на мета, @Michael, но не здесь. Если вы откроете дискуссию, я буду утверждать, что «форма» и «другие альтернативы» слишком расплывчаты, чтобы считаться ответами, как мягко пытался предложить MånsT. Конечно, между статусом ответа и статусом комментария есть серая область. Как модератор и рецензент, меня постоянно вызывают, чтобы определить, когда потенциальные ответы действительно функционируют как комментарии: этот тест на неопределенность - это то, что я пытаюсь последовательно применять.
whuber
9
@ Braj-Stat, следует отметить, что «требование» (такое, как оно есть) для теста хи-квадрат состоит в том, что ожидаемые значения > 5 во всех ячейках, а не необработанные значения, хотя вы все равно можете нарушать это правило большой палец, и / или хотите запустить другой тест в любом случае.
gung - Восстановить Монику

Ответы:

8

Коновер (1999: 202) предположил, что ожидаемые значения могут быть «всего лишь 0,5, если большинство из них больше 1,0, не ставя под угрозу достоверность теста».

Он также приводит «практическое правило» Кокрана (1952), в котором говорится, что если ожидаемые значения меньше 1 или если более 20% меньше 5, тест может работать плохо. Тем не менее, Коновер (1999) предоставляет некоторые доказательства того, что «эмпирическое правило» Кохрана является чрезмерно консервативным.

Ссылки

Cochran, WG 1952. The χ2проверка на пригодность Анналы математической статистики 23: 315-345.

Коновер, WJ 1999. Практическая непараметрическая статистика. Третье издание. John Wiley & Sons, Inc., Нью-Йорк, Нью-Йорк, США.

RioRaider
источник
5

χ2-Проверка была первоначально разработана Пирсоном как приближение к логарифмическому отношению правдоподобия, потому что логарифмические правдоподобия были слишком интенсивными в вычислительном отношении в то время.

G Пирсона определяется как граммзнак равно2ΣяJОяJпер(ОяJ/ЕяJ), Это следует тому же распределению, что и соответствующиеχ2-тестовое задание.

(Забыл упомянуть изначально: G гораздо менее чувствителен к ожидаемому количеству клеток <5).

abaumann
источник