Я только что прочитал статью, в которой авторы провели множественную регрессию с двумя предикторами. Общее значение r-квадрата составило 0,65. Они предоставили таблицу, которая делит r-квадрат между двумя предикторами. Стол выглядел так:
rsquared beta df pvalue
whole model 0.65 NA 2, 9 0.008
predictor 1 0.38 1.01 1, 10 0.002
predictor 2 0.27 0.65 1, 10 0.030
В этой модели, R
использующей mtcars
набор данных, общее значение r-квадрата составляет 0,76.
summary(lm(mpg ~ drat + wt, mtcars))
Call:
lm(formula = mpg ~ drat + wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.4159 -2.0452 0.0136 1.7704 6.7466
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.290 7.318 4.139 0.000274 ***
drat 1.442 1.459 0.989 0.330854
wt -4.783 0.797 -6.001 1.59e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared: 0.7609, Adjusted R-squared: 0.7444
F-statistic: 46.14 on 2 and 29 DF, p-value: 9.761e-10
Как я могу разделить значение r-квадрат между двумя переменными предиктора?
Ответы:
Вы можете просто получить две отдельные корреляции и возвести их в квадрат или запустить две отдельные модели и получить R ^ 2. Они будут суммироваться, только если предикторы ортогональны.
источник
Кроме того ответу Джона , вы можете получить квадратичные полуп частичные корреляции для каждого предиктора.
Если вы ищете функцию R есть
spcor()
вppcor
пакете.Вы также можете рассмотреть более широкую тему оценки важности переменных в множественной регрессии (например, см. Эту страницу о пакете relayimpo ).
источник
Я добавил тег дисперсии-разложения к вашему вопросу. Вот часть ее тега вики :
Одним из распространенных методов является добавление регрессоров в модель по одному и запись увеличения мере добавления каждого регрессора. Поскольку это значение зависит от регрессоров, уже имеющихся в модели, это необходимо делать для каждого возможного порядка, в котором они могут войти в модель, а затем усреднить по порядкам. Это выполнимо для маленьких моделей, но становится слишком сложным для больших моделей, поскольку число возможных порядков равно p ! для рR2 p! p предикторов.
Grömping (2007, Американский статистик ) дает обзор и ссылки на литературу в контексте оценки переменной важности.
источник
y ~ a + b
y ~ b + a
y ~ a
y ~ a + b
y ~ b
y ~ a + b
y ~ b + a
a
a
b
y~1
y~a
b
y~b
y~a+b