Почему произведение двухфакторных коэффициентов регрессии линии -on- линии -on- равно квадрату корреляции?

11

Есть модель регрессии, где с и , у которой есть коэффициент корреляции .a = 1,6 b = 0,4 r = 0,60302Y=a+bXa=1.6b=0.4r=0.60302

Если и затем переключаются, и уравнение становится где и , оно также имеет значение .Y X = c + d Y c = 0,4545 d = 0,9091 r 0,60302XYX=c+dYc=0.4545d=0.9091r0.60302

Я надеюсь, что кто-то может объяснить, почему также . 0,60302(d×b)0.50.60302

Майк
источник

Ответы:

10

Взгляните на Тринадцать способов взглянуть на коэффициент корреляции - и особенно способы 3, 4, 5 будут наиболее интересны для вас.

любознательный
источник
2
Вероятно, это должен был быть комментарий. Обратите внимание, что ссылка исчезла. Я обновил ссылку и предоставил полную цитату. Можете ли вы уточнить или предоставить какую-либо дополнительную информацию, которая будет по-прежнему полезна, даже если ссылка снова не работает?
gung - Восстановить Монику
2
Статья Rodgers & Nicewander представлена ​​на нашем сайте stats.stackexchange.com/q/70969/22228 .
whuber
3

Напомним, что многие вводные тексты определяют

Sxy=i=1n(xix¯)(yiy¯)

Тогда, установив качестве мы получаем и аналогично .yxSxx=i=1n(xix¯)2Syy=i=1n(yiy¯)2

Формулы для коэффициента корреляции , наклон -on- регрессия (ваш ) и наклон -on- регрессии (ваш ) часто задаются в виде:ryxbxyd

(1)r=SxySxxSyy(2)β^y on x=SxySxx(3)β^x on y=SxySyy

Тогда умножение и ясно дает квадрат :(2)(3)(1)

β^y on xβ^x on y=Sxy2SxxSyy=r2

В качестве альтернативы, числители и знаменатели дробей в , и часто делятся на или так что вещи структурируются в терминах выборочных или оценочных дисперсий и ковариаций. Например, из оценочный коэффициент корреляции представляет собой просто оценочную ковариацию, масштабированную по оценочным стандартным отклонениям:(1)(2)(3)n(n1)(1)

(4)r=Corr^(X,Y)=Cov^(X,Y)SD(X)^SD(Y)^(5)β^y on x=Cov^(X,Y)Var(X)^(6)β^x on y=Cov^(X,Y)Var(Y)^

Затем из умножения и сразу же получим, что(5)(6)

β^y on xβ^x on y=Cov^(X,Y)2Var(X)^Var(Y)^=(Cov^(X,Y)SD(X)^SD(Y)^)2=r2

Вместо этого мы могли бы переставить чтобы записать ковариацию как «увеличенную» корреляцию:(4)

(7)Cov^(X,Y)=rSD(X)^SD(Y)^

Затем, подставив в и мы могли бы переписать коэффициенты регрессии как и . Умножение их вместе также даст , и это решение @ Karl. Запись наклонов таким способом помогает объяснить, как мы можем видеть коэффициент корреляции как стандартизированный наклон регрессии .(7)(5)(6)β^y on x=rSD^(y)SD^(x)β^x on y=rSD^(x)SD^(y)r2


Наконец, обратите внимание, что в вашем случае но это произошло из-за вашей корреляции был положительным. Если бы ваша корреляция была отрицательной, вам пришлось бы принять отрицательный корень.r=bd=β^y on xβ^x on y

Для того, чтобы работать , является ли ваша корреляция положительна или отрицательна, вам просто нужно рассматривать знак (плюс или минус) вашего коэффициента регрессии - это не имеет значения , смотрите ли вы на -он-0 или -on- так как их знаки будут одинаковыми. Таким образом, вы можете использовать формулу:х хyxxy

r=sgn(β^y on x)β^y on xβ^x on y

где - это функция signum , т.е. если наклон положительный, и если наклон отрицательный.+ 1sgn+11

тарпон
источник
1
Возможно, этот мой ответ вас заинтересует, хотя он явно не затрагивает заданный здесь вопрос.
Dilip Sarwate