Почему корреляция остатков не имеет значения при тестировании на нормальность?

9

Когда (то есть Y происходит из модели линейной регрессии), ε N ( 0 , σ 2 I )Y=AX+εY И в этом случае невязок е 1 , ... , е п коррелируют и ненезависимыми. Но когда мы делаем регрессионную диагностику и хотим проверить предположение , е ~ N ( 0 , σ 2 I ) , каждый учебник предлагает использовать Q-Q графику и статистические тесты на Разность е , которые были разработанычтобы проверитьли е ~ N ( 0 , σ 2 I ) для некоторого σ 2R .

εN(0,σ2I)e^=(IH)YN(0,(IH)σ2)
e^1,,e^nεN(0,σ2I)e^e^N(0,σ2I)σ2R

Почему для этих тестов не имеет значения, что остатки коррелированы, а не независимы? Часто предлагается использовать стандартизированные но это только делает их гомоскедастичными, а не независимыми.

e^i=e^i1hii,

Перефразируя вопрос: остатки от регрессии МНК коррелируют. Я понимаю, что на практике эти корреляции настолько малы (в большинстве случаев «всегда»), что их можно игнорировать при проверке, получены ли остатки от нормального распределения. У меня вопрос, почему?

Зоран Лонаревич
источник
1
Делает их гомоскедастиками.
Scortchi - Восстановить Монику
1
Вы спрашиваете о применимости этих тестов, когда остатки имеют сильные корреляции, или вы просто обеспокоены (очень слабой и несущественной) отрицательной корреляцией, возникающей в результате процедуры наименьших квадратов?
whuber
1
@whuber Я спрашиваю о корреляции, возникающей из процедуры наименьших квадратов Если они незначительные и несущественные, я хотел бы знать, почему.
Зоран Лонаревич

Ответы:

3

HXM:=InH

XRn×ke^Rn

εXεspan(X)y=Xβ+ε=y~+εy~εy~=Xβspan(X)yε

b1,,bnRnb1,,bkspan(X)bk+1,,bnspan(X)ε=α1b1++αnbnαii{1,,k}Xβspan(X)

εe^ne^RneRnk

eNnk(0,σ2Ink),
ee

В короткой статье «Проверка регрессионных возмущений на нормальность» вы найдете сравнение остатков OLS и BLUS. В тестируемой установке Монте-Карло остатки OLS превосходят остатки BLUS. Но это должно дать вам некоторую отправную точку.

Марко Брайтиг
источник