Какова статистическая разница между выполнением линейной регрессии в R с formula
набором y ~ x + 0
вместо y ~ x
? Как мне интерпретировать эти два разных результата?
11
Какова статистическая разница между выполнением линейной регрессии в R с formula
набором y ~ x + 0
вместо y ~ x
? Как мне интерпретировать эти два разных результата?
Добавление +0
(или -1
) к модельной формуле (например, в lm()
) в R подавляет перехват. Обычно это считается плохой вещью; видеть:
Предполагаемый наклон рассчитывается по-разному в зависимости от того, оценивается ли пересечение, а именно:
Вот основные формулы:
Это зависит от контекста (конечно), в
lm(...)
команде в R он будет подавлять перехват. То есть вы делаете регресс, хотя происхождение.Обратите внимание, что большинство учебников по предмету регрессии скажут вам, что форсирование перехвата (с любым значением) - плохая идея.
Интерпретация x не меняется, но значение (по сравнению с и без перехвата) изменится, иногда очень значительно.
источник