Являются ли оценки коэффициентов регрессии некоррелированными?

11

Рассмотрим простую регрессию (нормальность не предполагается): где со средним и стандартным отклонением . Являются ли оценки наименьших квадратов и некоррелированными?

Yi=a+bXi+ei,
ei0σab
Арнаб
источник
2
Что вы думаете? en.wikipedia.org/wiki/Ordinary_least_squares , раздел «Свойства конечного образца». На этот вопрос много раз отвечали на этом сайте.
mpiktas

Ответы:

15

Это важное соображение при планировании экспериментов, где может быть желательно не иметь (или очень мало) корреляции между оценками и . Такое отсутствие корреляции может быть достигнуто путем управления значениями .a^b^Xi


Чтобы проанализировать влияние на оценки, значения (которые являются векторами строк длины ) собраны вертикально в матрицу , матрицу проектирования, имеющую столько строк, сколько имеется данных, и (очевидно, ) две колонки. Соответствующие собраны в один длинный (столбчатый) вектор . В этих терминах, записывая для собранных коэффициентов, модельXi(1,Xi)2XYiyβ=(a,b)

E(Y)=Xβ

(обычно) предполагается, что независимые случайные величины, дисперсии являются постоянным для некоторого неизвестного . Зависимые наблюдения принимается одним реализации векторной случайной величины .Yiσ2σ>0yY

Решение OLS является

β^=(XX)1Xy,

Предполагая, что обратная матрица существует. Таким образом, используя основные свойства умножения матриц и ковариации,

Cov(β^)=Cov((XX)1XY)=((XX)1Xσ2X(XX)1)=σ2(XX)1.

Матрица имеет всего две строки и два столбца, соответствующих параметрам модели . Корреляция с пропорциональна недиагональ- элементов который по правилу Крамера пропорциональны скалярному произведению двух столбцов . Так как один из столбцов равен всем с, а точечное произведение с другим столбцом (состоящим из ) является их суммой, находим(XX)1(a,b)a^b^(XX)1,X1Xi

a^ и не коррелированы, если и только сумма (или эквивалентно среднее) равна нулю.b^Xi

Это условие ортогональности часто достигается за счет центрирования на (путем вычитания их среднего значения из каждого). Хотя это не изменит предполагаемый наклон , это действительно изменит предполагаемый перехват . Важность этого зависит от приложения.Xib^a^


Этот анализ применяется к множественной регрессии: матрица проектирования будет иметь столбцы для независимых переменных (дополнительный столбец состоит из с), а будет вектором длины , но в остальном все проходит как прежде. p+1p1βp+1

На обычном языке два столбца называются ортогональными, когда их произведение на точки равно нулю. Когда один столбец (скажем, столбец ) ортогонален всем другим столбцам, это легко продемонстрировать алгебраическим фактом, что все недиагональные записи в строке и столбце из равны нулю (то есть компоненты и для всех равны нулю). Следовательно,XXiii(XX)1ijjiji

Две оценки коэффициента множественной регрессии и не коррелированы всякий раз, когда один (или оба) из соответствующих столбцов матрицы проектирования ортогональны всем другим столбцам. β Jβ^iβ^j

Многие стандартные экспериментальные планы состоят из выбора значений независимых переменных, чтобы сделать столбцы взаимно ортогональными. Это «разделяет» полученные оценки, гарантируя - до того, как будут собраны какие-либо данные! - что оценки будут некоррелированными. (Когда ответы имеют нормальное распределение, это означает, что оценки будут независимыми, что значительно упрощает их интерпретацию.)

Whuber
источник
Ответ гласит: «[...] недиагональные элементы, которые являются просто точечными произведениями двух столбцов X». Это верно для , но не ? ( X ' X ) - 1XX(XX)1
Гейзенберг
@ Heisenberg Это хороший момент. Мне было неясно по этому поводу. В случае двух столбцов нет никакой двусмысленности, но мне нужно подумать, как улучшить представление для случая большего количества столбцов.
whuber
@ Heisenberg Я благодарен за ваше проницательное наблюдение: оно позволило мне исправить существенную ошибку в обсуждении случая множественной регрессии.
whuber