Дисперсионно-ковариационная матричная интерпретация

12

Предположим, у нас есть линейная модель Model1и vcov(Model1)дает следующую матрицу:

             (Intercept)    latitude  sea.distance   altitude
(Intercept)    28.898100 -23.6439000  -34.1523000  0.50790600
latitude      -23.643900  19.7032500   28.4602500 -0.42471450
sea.distance  -34.152300  28.4602500   42.4714500 -0.62612550
altitude        0.507906  -0.4247145   -0.6261255  0.00928242

Для этого примера, что на самом деле отображает эта матрица? Какие предположения мы можем безопасно сделать для нашей модели и ее независимых переменных?

Murania
источник

Ответы:

11

Эта матрица отображает оценки дисперсии и ковариации между коэффициентами регрессии. В частности, для вашей матрицы проектирования и оценки дисперсии ваша отображаемая матрица будет .σ 2 σ 2 ( Х ' х ) - 1Xσ^2σ^2(XX)1

Диагональные элементы представляют собой дисперсию коэффициентов регрессии, а недиагональные значения - ковариацию между соответствующими коэффициентами регрессии.

Что касается предположений, примените функцию cov2cor () к вашей матрице дисперсии и ковариации. Эта функция преобразует данную матрицу в матрицу корреляции. Вы получите оценки корреляции между коэффициентами регрессии. Подсказка: для этой матрицы каждая из корреляций будет иметь большие величины.

Чтобы сказать что-то о модели в частности, нам нужны точечные оценки коэффициентов регрессии, чтобы сказать что-то еще.

Donnie
источник
11

@Донни дала хороший ответ (+1). Позвольте мне добавить пару очков.

Вниз по главной диагонали матрицы дисперсии-ковариации находятся дисперсии распределений выборки ваших оценок параметров (т. 's). Таким образом, получение квадратного корня из этих значений приводит к стандартным ошибкам, о которых сообщается в статистическом выводе: β^j

SEs   = sqrt(diag(vcov(Model1)))
SEs
# [1] 5.37569530 4.43883431 6.51701235 0.09634532

Они используются для формирования доверительных интервалов и проверки гипотез о ваших бета-версиях.

Недиагональные элементы были бы если бы все переменные были ортогональны, но ваши значения далеки от . Использование функции или стандартизация ковариаций по квадратным корням составляющих переменных дисперсий показывает, что все переменные сильно коррелированы ( ), поэтому вы имеете существенную мультиколлинеарность . Это делает ваши стандартные ошибки намного больше, чем они были бы в противном случае. Кроме того, это означает, что имеется большое количество информации о распределении выборок бета-версий, которая не входит в стандартные тесты гипотез ( ), поэтому вы можете использовать последовательная стратегия тестирования на основе сумм типа I квадратов . 0 | г | > 0,97 β J / S Е ( β J )00cov2cor()|r|>.97β^j/SE(β^j)

Gung - Восстановить Монику
источник