Согласно регрессионному анализу на примере , остаток представляет собой разницу между откликом и прогнозируемым значением, тогда говорят, что каждый остаток имеет различную дисперсию, поэтому нам нужно рассмотреть стандартизированные остатки.
Но дисперсия относится к группе значений, как одно значение может иметь дисперсию?
regression
residuals
ccshao
источник
источник
Ответы:
Я бы сказал, что индивидуальное число (например, остаток), полученное в результате случайного извлечения из распределения вероятностей, является реализованным значением , а не случайной величиной . Кроме того, я хотел бы сказать , что множество остатков, рассчитанный на основе данных и ваша модель подходит , используя е = у - у , представляет собой набор реализованных значений. Этот набор чисел может быть свободно концептуализирован как независимый от базового распределения ϵ ~ N ( μ , σ 2 )N е = у - у^ ε N(μ,σ2) N e ∑ei=0 ∑xiei=0
Теперь, учитывая некоторый набор чисел, будь они невязок или любой другой , это, конечно , верно , что они имеют дисперсию, , но это неинтересно. Что нас волнует, так это возможность что-то сказать о процессе генерирования данных (например, оценить дисперсию распределения населения). Используя предыдущую формулу, мы могли бы дать приближение, заменив N остаточными степенями свободы, но это не может быть хорошим приближением. Это тема, которая может быть очень сложной очень быстро, но несколько возможных причин могут быть гетероскедастичностью∑(ei−e¯)2/N N (то есть, что дисперсия населения отличается на разных уровнях ), и наличие выбросов (то есть, что данный остаток извлекается из другой популяции полностью). Практически наверняка на практике вы не сможете оценить дисперсию популяции, из которой был получен выброс, но, тем не менее, теоретически он имеет дисперсию. Я подозреваю, что что-то в этом роде имело в виду авторы, однако я должен отметить, что я не читал эту книгу. x
источник