У меня есть набор данных с двумя категориальными номинальными переменными (обе с 5 категориями). Я хотел бы знать, если (и как) я могу определить потенциальные корреляции между категориями из этих двух переменных.
Другими словами, показывают ли, например, результаты категории в переменной 1 сильную корреляцию с определенной категорией j в переменной 2. Поскольку у меня есть две переменные с 5 категориями, общий корреляционный анализ для всех категорий снизится до 25 результатов (по крайней мере, если это работает так, как я надеюсь / ожидаю, что это будет работать).
Я попытался сформулировать проблему в конкретные вопросы:
Вопрос 1: допустим, я передаю категориальную переменную в 5 различных фиктивных переменных на значение (категорию). Эту же процедуру я запускаю и для второй переменной. Затем я хочу определить соотношение между фиктивными 1.i и 2.i (например). Является ли для меня статистически правильным выполнение этой процедуры с помощью обычной процедуры коэффициента корреляции? Обеспечивает ли коэффициент корреляции, вытекающий из этой процедуры, правильное понимание корреляции между двумя фиктивными переменными?
Вопрос 2: Если процедура, описанная в первом вопросе, является действительной процедурой, есть ли способ выполнить этот анализ для всех категорий 2 (или, возможно, более) категориальных номинальных переменных одновременно?
Я использую программу SPSS (20).
Ответы:
p<0.05
Что касается вашего второго вопроса, о связях трехсторонней категории - это возможно как часть общего логлинейного анализа, который также отображает остатки. Тем не менее, практическое использование 3-сторонних остатков ячеек является скромным: 3 (+) - меры ассоциации не легко стандартизируются и не легко интерпретируются.
источник
Непосредственно взят из документа по двумерной статистике с SPSS, который живет здесь :
источник
the SPSS document
немного отредактировал, я не собирался придавать ему какую-либо излишнюю аутентичность.