Какая разница между несколькими R и R в квадрате?

14

В линейной регрессии мы часто получаем несколько R и R в квадрате. Каковы различия между ними?

RockTheStar
источник

Ответы:

15

Капитал (в отличие от r 2 ) обычно должен быть кратным R 2 в модели множественной регрессии. В двумерной линейной регрессии нет кратного R , и R 2 = r 2 . Таким образом, одним отличием является применимость: «множественный R » подразумевает множественные регрессоры, тогда как « R 2 » не обязательно.р2р2р2рр2знак равнор2рр2

Другое простое отличие - интерпретация. При множественной регрессии множественное является коэффициентом множественной корреляции , тогда как его квадрат является коэффициентом детерминации . R можно интерпретировать как коэффициент двумерной корреляции , главное отличие состоит в том, что множественная корреляция находится между зависимой переменной и линейной комбинацией предикторов, а не просто одним из них, а не только средним из этих двухфакторных корреляций. R 2 может быть интерпретирован как процент дисперсии в зависимой переменной, который может быть объяснен предикторами ; как и выше, это также верно, если существует только один предиктор.ррр2

Ник Стаунер
источник
5
Таким образом, если в множественной регрессии R ^ 2 равно 0,76, то мы можем сказать, что модель объясняет 76% дисперсии в зависимой переменной, тогда как если r ^ 2 составляет 0,86, мы можем сказать, что модель объясняет 86% дисперсия в зависимой переменной? Какая разница в их интерпретации?
wizlog
Как следует из ответа - «множественный R» подразумевает множественные регрессоры. Можно ли иметь несколько значений R в модели с одним регрессором?
Абрар
2

Множество R на самом деле можно рассматривать как корреляцию между откликом и подобранными значениями. Как таковая, она всегда позитивна. Множественный R-квадрат - это его квадратная версия.

Позвольте мне проиллюстрировать на небольшом примере:

set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)

fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared:  0.2347

(R <- cor(y, fitted(fit))) # 0.4845068
R^2                        # 0.2347469

Нет необходимости поднимать шум вокруг «множества» или нет. Эта формула всегда применяется, даже в настройках Anova. В случае, когда существует только одна ковариабельная , тогда R со знаком наклона совпадает с корреляцией между X и откликом.ИксИкс

Майкл М
источник
0

Я просто объясняю своим студентам, что:

  1. кратное число R следует рассматривать как абсолютное значение коэффициента корреляции (или коэффициента корреляции без отрицательного знака)!

  2. R-квадрат - это просто квадрат кратного R. Он может быть выражен в процентах от изменения, вызванного независимой переменной (переменными).

Таким образом, легко понять концепцию и разницу.

Senith
источник