По-видимому, коэффициент корреляции Пирсона параметрический, а число Спирмена непараметрическое.
У меня проблемы с пониманием этого. Насколько я понимаю, Пирсон вычисляется как и вычисляется таким же образом, за исключением того, что мы подставляем все значения в их ранги.
Википедия говорит
Разница между параметрической моделью и непараметрической моделью заключается в том, что первая имеет фиксированное количество параметров, а вторая увеличивает количество параметров с количеством обучающих данных.
Но я не вижу никаких параметров, кроме самих образцов. Некоторые говорят, что параметрические тесты предполагают нормальное распределение и продолжают утверждать, что Пирсон принимает нормальные распределенные данные, но я не понимаю, почему Пирсон этого потребовал.
Итак, мой вопрос: что означают параметрические и непараметрические значения в контексте статистики? И как там Пирсон и Спирман?
источник
Ответы:
Проблема в том, что в наши дни «непараметрический» действительно имеет два разных значения. Определение в Википедии относится к таким вещам, как аппроксимация кривой, например, с помощью сплайнов или локальной регрессии. Другое значение, которое является более старым, больше соответствует принципу «без распространения», то есть методам, которые могут применяться независимо от предполагаемого распределения данных. Последний является тем, который применяется к ро Спирмена, поскольку преобразование ранга подразумевает, что оно даст тот же результат, независимо от того, каким было ваше первоначальное распределение.
источник
Я думаю, что единственная причина, по которой коэффициент корреляции Пирсона будет называться параметрическим, заключается в том, что вы можете использовать его для оценки параметров многомерного нормального распределения. например, двумерное нормальное распределение имеет 5 параметров: два средних, две дисперсии и коэффициент корреляции. Последнее можно оценить с помощью коэффициента корреляции Пирсона.
источник
Простейший ответ, который я считаю, заключается в том, что в тесте Спирмена на роу используются порядковые данные (числа, которые можно ранжировать, но не сообщают вам ничего о интервале между числами, например, 3 вида мороженого ранжируются 1, 2 и 3, но это говорит только о том, какие вкус был предпочтительнее, чем на сколько). Порядковые данные не могут быть использованы в параметрических тестах.
В тесте Пирсона используются данные об интервалах или соотношениях (числа с фиксированными интервалами, например, секунды, кг, мм). 1 мм не только меньше, чем 5 мм, но вы точно знаете, сколько на. этот тип данных может быть использован в параметрическом тесте.
источник