Как на практике вычисляется матрица ошибок var / cov с помощью пакетов статистического анализа?
Эта идея понятна мне в теории. Но не на практике. Я имею в виду, что если у меня есть вектор случайных величин , я понимаю, что матрице дисперсии / ковариации Σ будет дан внешний продукт отклонения от средние векторы: Σ = E [ ( X - E ( X ) ) ( X - E ( X ) ) ⊤ ] .
Но когда у меня есть выборка, ошибки моих наблюдений не являются случайными величинами. Или лучше, но только если я возьму несколько одинаковых образцов из одной популяции. В противном случае они даны. Итак, опять мой вопрос: как статистический пакет может создать матрицу var / cov, начиная со списка наблюдений (то есть выборки), предоставленного исследователем?
Ответы:
Ковариационная матрица для модели типа обычно вычисляется как ( Х т Х ) - 1 σ 2Y= Хβ+ ϵ , гдеσ2является остаточной суммой квадратов,σ2=Σя(уя-Хя β )2иdпредставляет число степеней свободы (правилочисло наблюдений минус число параметров).
Для устойчивых и / или кластерных стандартных ошибок продукт изменяется незначительно. Также могут существовать другие способы вычисления ковариационной матрицы, например, как предполагается ожиданием внешних продуктов.ИксTИкс
источник
Это включено в книгу «Практическая регрессия и анова с использованием R» Джулиана Дж. Фаравея, стр. 21 .
Пример его вычисления в R, на основе линейной модели миль на галлон регрессировавших на нескольких автомобилей модели спецификации , включенной в
mtcars
базе данных:ols = lm(mpg ~ disp + drat + wt, mtcars)
. Это ручные вычисления и выводlm()
функции:оценивается как на странице 8 этого онлайн-документа как
источник
источник