Почему квадрат

12

Это может быть основной вопрос, но мне было интересно, почему значение в регрессионной модели может быть просто возведено в квадрат, чтобы дать цифру объясненной дисперсии?R

Я понимаю, что коэффициент может дать силу отношения, но я не понимаю, как просто возводить в квадрат это значение дает меру объясненной дисперсии.R

Любое простое объяснение этого?

Большое спасибо за помощь с этим!

Дэвид
источник
Вы ищете что-то интуитивное или более математическое? Вы просматривали некоторые другие вопросы о и коэффициентах корреляции на этом сайте? R2
кардинал
1
Два связанных вопроса здесь и здесь , например. Если вы поиграете с уравнениями там, вы сможете получить математическую эквивалентность. Но ни один из них, вероятно, не будет особенно полезен с точки зрения интуиции.
кардинал
Я вижу это наоборот. Это R квадрат, который определяется как 1-остаточная дисперсия / общая дисперсия, и тогда R является положительным квадратным корнем этого. Просто так получается, что при простой линейной регрессии R квадрат уменьшается до квадрата коэффициента корреляции.
Майкл Р. Черник
@ Майкл, вы, несомненно, намеревались сказать квадратный корень с правильной подписью, а не положительный .
кардинал
1
@cardinal, у меня такое же впечатление - (или r ) относится к коэффициенту корреляции выборки и был бы удивлен, увидев широко используемую ссылку, которая использует его для обозначения абсолютного значения корреляции выборкиRr
Макро

Ответы:

15

Ручной wavingly, соотношение можно рассматривать как меру угла между двумя векторами, зависимым вектором Y и независимым вектором X . Если угол между векторами равен θ , корреляция R равна cos ( θ ) . Часть Y, которая объясняется X, имеет длину | | Y | | cos ( θ ) и параллельно X (или проекции Y на X ). Часть, которая не объяснена, имеет длинуRYXθRcos(θ)YX||Y||cos(θ)XYX и ортогональна X . В терминах дисперсий мы имеем σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ), где первый член справа является объясненной дисперсией, а второй - необъяснимой дисперсией. Фракциякоторая объясняется, таким образом , R 2 ,не R .||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R
Дилип Сарватэ
источник
2
(+1) Здесь на самом деле не слишком много рукопожатий. Геометрическая точка зрения является , на мой взгляд, наиболее интуитивной. Вероятно, существует качественная фигура с открытым исходным кодом, которая изображает вещи именно таким образом.
кардинал
cor(y,y^)2R2
1
Это не отвечает на вопрос, но показывает, как квадрат R упоминается как квадрат коэффициента корреляции без какой-либо ссылки на R. Таким образом, источники, подтверждающие или опровергающие мое утверждение, могут быть трудно найти. Это из статьи о коэффициенте детерминации в Википедии:
Майкл Р. Черник
Как квадратный коэффициент корреляции Аналогично, после регрессии по методу наименьших квадратов с помощью константы + линейная модель (т. Е. Простая линейная регрессия) R2 равен квадрату коэффициента корреляции между наблюдаемыми и смоделированными (прогнозируемыми) значениями данных.
Майкл Р. Черник
В общих условиях значение R2 иногда рассчитывается как квадрат коэффициента корреляции между исходными и смоделированными значениями данных. В этом случае значение не является прямой мерой того, насколько хороши смоделированные значения, а скорее мерой того, насколько хорошо можно построить предиктор из смоделированных значений (путем создания пересмотренного предиктора в форме α + βƒi). Согласно Everitt (2002, стр. 78), это использование является определением термина «коэффициент детерминации»: квадрат корреляции между двумя (общими) переменными.
Майкл Р. Черник