Что означают нормальные остатки и что это говорит мне о моих данных?

13

Довольно простой вопрос:

Что означает нормальное распределение остатков от линейной регрессии? С точки зрения того, как это отражается на моих исходных данных регрессии?

Я в полном замешательстве, спасибо, ребята

SMAR
источник

Ответы:

5

β0β1

E[Y|X]=β0+β1X
YX

YXYXX

YE[Y|X]XYβ0+β1XE[Y|X]ϵ

Y=E[Y|X]+ϵ

Короче говоря: это нормальное распределение представляет изменчивость вашего результата на вершине изменчивости, объясненной моделью.

YX

Примечание: я обосновал линейную регрессию одним предиктором, но то же самое можно сказать и о большем: просто замените «линию» на «гиперплоскость» выше.

Ник Саббе
источник
Это отличное объяснение! Однако один вопрос: если e нормально распределен, это означает, что вы предполагаете, что наиболее вероятные значения e находятся в диапазоне от -1 до +1 (после того, как они были стандартизированы)? Таким образом, вы в основном используете нормальное распределение вместо, скажем, распределения Пуассона, потому что нормальное распределение лучше моделирует, как эти значения ведут себя в реальной жизни?
user3813234
1

Это может много значить или ничего не значить. Если вы подходите модели, чтобы получить самый высокий R-квадрат, это может означать, что вы были глупы. Если вы подходите для того, чтобы модель была скупой в том смысле, что переменные необходимы и необходимы, и вы заботитесь о выявлении выбросов, то вы хорошо поработали. Посмотрите здесь для получения дополнительной информации по этому http://www.autobox.com/cms/index.php?option=com_content&view=article&id=175

Том Рейли
источник
0

Нормальность остатков - это предположение о работе линейной модели. Таким образом, если ваши остатки нормальны, это означает, что ваше предположение является верным, и вывод модели (доверительные интервалы, прогнозирование модели) также должен быть действительным. Это так просто!

wcampbell
источник
Предположение о нормальности относится к ненаблюдаемой ошибке (отсюда необходимость допущения), а не к наблюдаемым невязкам.
DL Dahly
2
Да, но вы используете остатки для проверки вашего предположения о ненаблюдаемой ошибке.
wcampbell
 to