Коэффициент Пирсона между двумя переменными довольно высок (г = 0,65). Но когда я ранжирую значения переменных и запускаю корреляцию Спирмена, значение коэффициента намного ниже (r = .30).
- Какова интерпретация этого?
correlation
spearman-rho
user3671
источник
источник
Ответы:
Почему большая разница
Если ваши данные нормально распределены или распределены равномерно, я думаю, что соотношение Спирмена и Пирсона должно быть довольно схожим.
Если они дают очень разные результаты, как в вашем случае (.65 против .30), я предполагаю, что вы отклонили данные или выбросы, и что выбросы приводят к тому, что корреляция Пирсона больше, чем корреляция Спирмена. Т.е. очень высокие значения на X могут сочетаться с очень высокими значениями на Y.
Смежные вопросы
Также посмотрите эти предыдущие вопросы о различиях между корреляцией Спирмена и Пирсона:
Как выбрать соотношение Пирсона и Спирмена?
Корреляция Пирсона или Спирмена с ненормальными данными
Простой R Пример
Ниже приведено простое моделирование того, как это может произойти. Обратите внимание, что приведенный ниже случай включает в себя один выброс, но вы можете получить аналогичные эффекты с несколькими выбросами или искаженными данными.
Что дает этот вывод
Корреляционный анализ показывает, что без выброса Спирман и Пирсон довольно похожи, а с довольно экстремальным выбросом корреляция совершенно иная.
На графике ниже показано, как обработка данных как рангов устраняет экстремальное влияние выброса, что приводит к тому, что Spearman становится похожим как с выбросом, так и без него, тогда как Пирсон сильно отличается при добавлении выброса. Это подчеркивает, почему Спирмена часто называют крепким.
источник