В контексте регрессии OLS я понимаю, что остаточный график (в сравнении с установленными значениями) обычно рассматривается для проверки на постоянную дисперсию и оценки спецификации модели. Почему остатки отображаются в зависимости от подгонки, а не от значений ? Как информация отличается от этих двух графиков?
Я работаю над моделью, которая произвела следующие остаточные участки:
Таким образом, график против подогнанных значений выглядит хорошо с первого взгляда, но у второго графика против значения есть образец. Мне интересно, почему такой ярко выраженный паттерн не проявился бы и в сюжете «остаточный против подгонки» ...
Я не ищу помощи в диагностике проблем с моделью, а просто пытаюсь понять различия (как правило) между (1) остаточным и подходящим графиком и (2) остаточным по сравнению с графиком.
Что бы это ни стоило, я уверен, что схема ошибок на втором графике связана с отсутствием переменной (переменных), которые влияют на DV. В настоящее время я работаю над получением этих данных, которые, как я ожидаю, помогут в целом подгонке и спецификации. Я работаю с данными по недвижимости: DV = Цена продажи. IVs: Квадратный фут дома, количество гаражных мест, год постройки, год постройки .
источник
Ответы:
По построению член ошибки в модели OLS не связан с наблюдаемыми значениями X-ковариат. Это всегда будет верно для наблюдаемых данных, даже если модель дает смещенные оценки, которые не отражают истинные значения параметра, потому что допущение модели нарушается (например, проблема с пропущенной переменной или проблема с обратной причинностью). Прогнозируемые значения полностью зависят от этих ковариат, поэтому они также не связаны с погрешностью. Таким образом, когда вы вычерчиваете невязки против предсказанных значений, они всегда должны выглядеть случайными, потому что они действительно не коррелированы при построении оценки. В отличие от этого, вполне возможно (и действительно возможно), чтобы термин ошибки модели на практике коррелировал с Y. Например, с дихотомической переменной X, чем дальше истинное Y от
E(Y | X = 1)
илиE(Y | X = 0)
тогда чем больше будет остаток Вот та же интуиция с моделируемыми данными в R, где мы знаем, что модель несмещена, потому что мы контролируем процесс генерации данных:Мы получаем тот же результат нулевой корреляции с смещенной моделью, например, если мы опускаем
x1.
источник
Два факта, которые я предполагаю, что вы довольны мной, просто констатируете
Потом:
Таким образом, в то время как установленное значение не коррелирует с остатком, наблюдение есть .
По сути, это связано с тем, что как наблюдение, так и остаток относятся к члену ошибки.
Это обычно затрудняет использование остаточного графика в диагностических целях.
источник