Должен ли частичный составлять в сумме в множественной регрессии?

12

Ниже приводится модель, созданная из mtcarsнабора данных:

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

Модель кажется хорошей с общим 0,85. Однако частичные значения показанные на следующем графике, не суммируют с этим значением. Они составляют в целом около 0,28. R 2R2R2

> plot(anova(mod), what='partial R2')

введите описание изображения здесь

Существует ли какая-либо связь между суммой всех частичных и общей суммой ? Анализ сделан с пакетом. R 2R2R2rms

rnso
источник
1
(В дополнение к очень хорошему ответу амебы) Закрытый вопрос о стандартизированном коэффициенте регрессии и частичной корреляции stats.stackexchange.com/q/76815/3277 .
ttnphns

Ответы:

11

Нет.

Один из способов понять частичное для данного предиктора - это то, что оно равно которое вы получите, если сначала регрессируете свою независимую переменную для всех других предикторов , возьмите невязки и регрессируете те, что в оставшемся предикторе. R 2R2R2

Таким образом, если, например, все предикторы абсолютно идентичны (коллинеарны), можно иметь приличное , но частичное для всех предикторов будет точно равно нулю, потому что любой отдельный предиктор имеет нулевую дополнительную объяснительную силу. R 2R2R2

С другой стороны, если все предикторы вместе прекрасно объясняют зависимую переменную, т. Е. , тогда частичное для каждого предиктора также будет равно , потому что все, что не объяснено всеми остальными предикторами, может быть прекрасно объяснено оставшимися один.R 2 1R2=1R21

Таким образом, сумма всех частичных может легко быть ниже или выше общего . Они не должны совпадать, даже если все предикторы являются ортогональными. Частичное - немного странная мера.R 2 R 2R2R2R2

Посмотрите эту длинную ветку для более подробной информации: Важность предикторов в множественной регрессии: Частичное против стандартизированных коэффициентовR2 .

амеба говорит восстановить монику
источник
Спасибо за очень четкое объяснение. Это может происходить в ситуации с этим вопросом также: stats.stackexchange.com/questions/155447/… . Тогда является ли частичный R ^ 2 разумным показателем важности или вклада отдельных предикторов? Или вы бы предложили что-то еще, например «пропорция R ^ 2» или «оставшиеся R ^ 2» или «chisq» или «chisq минус df» или «пропорция chisq» или «aic»? Все они доступны в пакете rms. Или стандартизированные коэффициенты?
2012 года
Да, я не уверен, почему этот вопрос был отложен как неясный; Я думаю, что это ясно (и является почти дубликатом этого, но возможно не совсем). Относительно разумных показателей важности предикторов: я настоятельно рекомендую вам прочитать ветку, на которую я ссылаюсь в своем ответе, именно по этому вопросу. Там также есть мой собственный ответ, где я делаю краткий обзор нескольких различных показателей. Все они имеют различные недостатки; кажется, что нет (и не может быть) идеального решения этой проблемы.
амеба говорит восстановить Монику
Я отложил это как неясное, потому что вообще не было дано никакого объяснения того, как эти две модели различались. Возможно, я ошибался, думая, что нужен ответ для этой конкретной ситуации. Учитывая этот ответ, кто-нибудь из вас думает, что он нуждается в повторном открытии?
Scortchi - Восстановить Монику
Таким образом, частичные R2 сравнимы внутри одного графа, а не между двумя графами. Кроме того, «частичный R2» на самом деле не указывает на вклад в общее количество R2, и, следовательно, я думаю, что это неправильно. Теперь нет необходимости в другом вопросе, так как я получил ответ здесь.
rnso
Я голосовал против всех ответов. Уже тогда я принял подавляющее большинство своих вопросов.
rnso