Стандартная ошибка свободного члена ( β 0 ) в у = β 1 х + β 0 + ε задается S E ( β 0 ) 2 = σ 2 [ 1
Из того, что я понимаю, SE квантифицирует ваш uncertainty-, например, в 95% образцов, интервал будет содержать истинное & beta ; 0 . Я не понимаю, как SE, мера неопределенности, увеличивается с ˉ x . Если я просто перенесу свои данные, так что ˉ x = 0 , моя неопределенность уменьшится? Это кажется неразумным.
Аналогичная интерпретация - в uncentered версии моих соответствует моему предсказанию при х = 0 , в то время как в центрированных данных, & beta ; 0 соответствует моему предсказанию при й = ˉ х . Так значит ли это, что моя неопределенность в отношении моего прогноза при x = 0 больше, чем моя неопределенность в отношении моего прогноза при x = ˉ x ? Это тоже кажется необоснованным, ошибка ϵ имеет одинаковую дисперсию для всех значений x, поэтому моя неопределенность в моих предсказанных значениях должна быть одинаковой для всех .
Я уверен, что в моем понимании есть пробелы. Может ли кто-нибудь помочь мне понять, что происходит?
источник
Ответы:
Поскольку линия регрессии, соответствующая обычным наименьшим квадратам, обязательно пройдет через среднее значение ваших данных (т. Е. ) - по крайней мере, до тех пор, пока вы не подавите перехват - неопределенность относительно истинного значения наклон не оказывает никакого влияния на вертикальное положение линии на среднее значение х (т.е. при у ˉ х ). Это приводит к меньшей вертикальной неопределенности при ˉ x, чем дальше от ˉ x . Если перехват, где х = 0 является ˉ х(x¯,y¯) x y^x¯ x¯ x¯ x=0 x¯ , то это минимизирует вашу неопределенность относительно истинного значения β0 . В математических терминах это выражается в минимально возможное значение стандартной ошибки для р 0 . β^0
Вот быстрый пример в
R
:Эта цифра немного занята, но вы можете увидеть данные нескольких разных исследований, где распределение было ближе или дальше от 0 . Склоны немного отличаются от учебы к учебе, но в значительной степени похожи. (Обратите внимание , все они идут через кружок X , который я использовал для метки ( ˉ х , ˉ у ) .) Тем не менее, неопределенность относительно истинного значения этих склонов вызывают неопределенность у расширить в дальнейшем вы получите от ˉ х , Это означает, что S Ex 0 (x¯,y¯) y^ x¯ SE(β^0) очень широк для данных, которые были отобраны в окрестности , и очень узок для исследования, в котором данные были отобраны около х = 0 . x=10 x=0
Редактировать в ответ на комментарий: К сожалению, центрирование данные после того, как вы их не помогут вам , если вы хотите знать , вероятно значения при некотором х значений х новое . Вместо этого вам необходимо сосредоточить сбор данных на том месте, о котором вы заботитесь в первую очередь. Чтобы лучше понять эти проблемы, вам может помочь прочесть мой ответ здесь: Интервал прогнозирования линейной регрессии .y x xnew
источник