У меня есть куча связанных наборов данных. Корреляции Пирсона между их парами обычно определенно больше, чем корреляции Спирмена. Это говорит о том, что любая корреляция является линейной, но можно ожидать, что даже если бы Пирсон и Спирмен были одинаковыми. Что это означает, когда существует определенный разрыв между корреляцией Пирсона и Спирмена, а Пирсон больше? Кажется, это постоянная функция в моих наборах данных.
correlation
spearman-rho
pearson-r
Джон Робертсон
источник
источник
Ответы:
Корреляция Спирмена - это просто корреляция Пирсона, использующая ранги (статистику заказов) вместо фактических числовых значений. Ответ на ваш вопрос заключается в том, что они не измеряют одно и то же. Пирсон: линейный тренд, Спирмен: монотонный тренд. То, что корреляция Пирсона выше, означает, что линейная корреляция больше, чем ранговая корреляция. Вероятно, это связано с влиятельными наблюдениями в хвостах распределения, которые имеют большое влияние относительно их ранжированных значений. Тесты ассоциации, использующие корреляцию Пирсона, имеют большую мощность, когда линейность сохраняется в данных.
источник
Корреляция Пирсона предполагает несколько допущений для ее точности: 1) каждая переменная обычно распределена; 2) гомоскедастичность, дисперсия каждой переменной остается постоянной; и 3) Линейность, означающая, что график рассеяния, изображающий взаимосвязь, показывает точки данных, сгруппированные симметрично вокруг линии регрессии.
Корреляция Спирмена - непараметрическая альтернатива Пирсону, основанная на ранге наблюдений. Корреляция Спирмена позволяет вам ослабить все три предположения о вашем наборе данных и получить корреляции, которые все еще достаточно точны.
Ваши данные подразумевают, что они, вероятно, существенно нарушают одно или несколько из упомянутых допущений, так что две корреляции значительно различаются.
Учитывая, что у вас большой разрыв между двумя корреляциями, вы должны исследовать, являются ли переменные вашего набора данных нормально распределенными, гомоскедастичными и линейными в точечной диаграмме.
Приведенное выше исследование поможет вам принять решение о том, является ли коэффициент корреляции Спирмена или Пирсона более представительным.
источник