Я хотел бы понять, почему в рамках модели OLS RSS (остаточная сумма квадратов) распределяется ( - это число параметров в модели, - количество наблюдений).
Я прошу прощения за то, что задал такой простой вопрос, но мне кажется, что я не могу найти ответ онлайн (или в моих, более ориентированных на приложения, учебниках).
regression
distributions
least-squares
Таль Галили
источник
источник
Ответы:
Я рассматриваю следующую линейную модель: .Y= Xβ+ ϵ
Вектор невязок оценивается как
где .Q = я- Х( X'Икс)- 1Икс'
Заметим, чтоtr ( Q ) = n - p (след инвариантен относительно циклической перестановки) и что Q'= Q = Q2 . Следовательно, собственные значения Q равны 0 и 1 (некоторые детали приведены ниже). Следовательно, существует унитарная матрица В такая, что ( матрицы диагонализируются унитарными матрицами тогда и только тогда, когда они нормальны ).
Теперь пусть .К= V'ε^
Поскольку , мы имеем и, следовательно, . таким образомK~N(ε^∼ N( 0 , σ2Q ) К п - р + 1 = ... = К п = 0К∼ N( 0 , σ2Δ ) Кn - p + 1= … = КN= 0
с .К⋆= ( К1, … , Кн - р)'
Кроме того, поскольку является унитарной матрицей, мы также имеемВ
таким образом
Наконец, обратите внимание, что этот результат подразумевает, что
Поскольку , минимальный многочлен от делит многочлен . Итак, собственные значения находятся среди и . Поскольку также является суммой собственных значений, умноженных на их кратность, мы обязательно имеем, что является собственным значением с кратностью а ноль является собственным значением с кратностью .Q z 2 - z Q 0 1 tr ( Q ) = n - p 1 n - p pQ2- Q = 0 Q Z2- з Q 0 1 tr ( Q ) = n - p 1 н - р п
источник
ИМХО, матричная запись усложняет. Чисто векторное пространство языка чище. Модель можно записать в виде где имеет стандартное нормальное распределение на и предполагается, что принадлежит векторному подпространству .Y = μ + σ G G R n μ W ⊂ R nY= Xβ+ ϵ Y= μ + σг г рN μ W⊂ RN
Теперь в игру вступает язык элементарной геометрии. наименьших квадратов of - это не что иное, как : ортогональная проекция наблюдаемой на пространство которому, как предполагается, принадлежит . Вектор невязок - это : проекция на ортогональное дополнение к в . Размерность равна . МPWYYWМР ⊥ Ш УШ⊥ШРпШ⊥μ^ μ пWY Y W μ п⊥WY W⊥ W рN W⊥ dim(W⊥)=n−dim(W)
Наконец, а имеет стандартное нормальное распределение на , следовательно, его квадратная норма имеет распределение с степенями свободы.P ⊥ W G W ⊥ χ 2 дим ( W ⊥ )
Эта демонстрация использует только одну теорему, фактически теорему определения:
Определение и теорема . Случайный вектор в имеет стандартное нормальное распределение в векторном пространстве если он принимает свои значения в и свои координаты в одном ( во всех) ортонормированном базисе из являются независимыми одномерные стандартные нормальные распределения U⊂ R n UрN U⊂ RN U ⟺ U
(из этой теоремы определения теорема Кохрана настолько очевидна, что не стоит ее формулировать)
источник
Как только мы установим, что , мы можем применить следующую лемму:ϵ^=(I−H)ϵ
Лемма: Если является симметричной и идемпотентной вещественной матрицей, то существует матрицу с ортонормированными столбцами , такими , что . Матрица является , где равен рангу .An×n U A=UUT U n×r r A
Доказательство: спектральная теорема для симметричных матриц утверждает, чтогде- диагональная матрица собственных значенийдляи- ортогональная матрица, столбцами которой являются соответствующие собственные векторы. Посколькуидемпотент, каждое собственное значение равно нулю или единице (причина:влечет). Удалить изстолбцы, соответствующие нулевому собственному значению, оставивматрицу; диагональная матрицаA=UDUT Dn×n λ1,…,λn A Un×n u1,…,un A Au=λu λu=Au=A(Au)=Aλu=λ2u U n×r D r U у я = U я ранг (становится личностью. Чтобы определить , обратите внимание, что каждый столбец, остающийся в удовлетворяет , следовательно, они образуют основу для диапазона ; так что .r U Aui=ui A rank(A)=r
Применяя лемму, напишите где имеет ортонормированные столбцы и . Тогда . Заметим, что является мерным случайным вектором, имеющим многомерное нормальное распределение со средним нулем и ковариационной матрицей и это Заключить - это сумма квадратовI−H=UUT Un×r r=rank(I−H) ε : = ( I - Н ) ε = U ( U T ε ) N : = U T & epsi ; г вар ( Н ) = Е ( U T ϵ ) ( U T ϵ ) T =ϵ^:=(I−H)ϵ=U(UTϵ) N:=UTϵ r Var(N)=E(UTϵ)(UTϵ)T=UTE(ϵϵT)U=σ2(UTU)=σ2Ir×r RSS:=ϵ^Tϵ^=(UN)T(UN)=NT(UTU)N=NTN. RSS/σ2 r IID стандартные нормальные переменные и, следовательно, имеет распределение хи-квадрат ( ).r
Чтобы закончить, находим : рассмотрим для разложение . Идемпотентность подразумевает для всех , откуда является прямой суммой подпространств и и т.r=n−rank(X) v∈Rn v=Hv+(I−H)v H (Hv)T(I−H)v′=0 v,v′ Rn range(H) range(I−H) n=dimrange(H)+dimrange(I−H)=rank(H)+rank(I−H)=rank(X)+r.
источник