Доверительный интервал для различия средств в регрессии

10

Предположим, у меня есть модель квадратичной регрессии с ошибками удовлетворяющими обычным предположениям (независимым, нормальным, независимым от значений ). Пусть - оценки наименьших квадратов.

Y=β0+β1X+β2X2+ϵ
ϵXb0,b1,b2

У меня есть два новых значения и , и я заинтересован в получении доверительного интервала для .Xx1x2v=E(Y|X=x2)E(Y|X=x1)=β1(x2x1)+β2(x22x12)

Точечная оценка: , и (исправьте меня, если я ошибаюсь) я могу оценить дисперсию с помощью с использованием оценок дисперсии и ковариации коэффициентов, предоставленных программным обеспечением.v^=b1(x2x1)+b2(x22x12)

s^2=(x2x1)2Var(b1)+(x22x12)2Var(b2)+2(x2x1)(x2x12)Cov(b1,b2)

Я мог бы использовать нормальное приближение и взять в качестве 95% -ного доверительного интервала для , или я мог бы использовать доверительный интервал начальной загрузки, но есть ли способ определить точное распределение и использовать это?v^±1.96s^v

mark999
источник
2
Поскольку ошибки предполагаются нормальными, то оценки параметров, являющиеся линейными функциями данных, откуда и ошибки, сами должны быть нормальными, что подразумевает нормальное распределение для . v^
whuber
Так вы говорите, что нормальный доверительный интервал правильный? Если я правильно понимаю, по этой логике мы также будем использовать нормальные доверительные интервалы для параметров. Но мы используем интервалы, основанные на распределении t.
mark999
Распределение t используется, потому что вы оцениваете дисперсию ошибки; если бы это было известно, то у вас был бы нормальный дистрибутив, как говорит @whuber.
JMS
Спасибо за ваш комментарий. Я спрашиваю, можно ли также использовать распределение t для доверительного интервала для v, как это определено в вопросе, и, если да, со сколькими степенями свободы?
mark999
Все дисперсии и ковариации в конечном итоге зависят от оценочной дисперсии остатков. Таким образом, DF для использования - это DF в этой оценке, равный количеству значений данных минус количество параметров (включая константу).
whuber

Ответы:

9

Общий результат вы ищете (при сделанных предположениях) выглядит следующим образом : Для линейной регрессии с предикторами ( у вас есть два, и ) и перехват, то с наблюдениями, матрица плана , мерной оценки иpXX2nXn×(p+1)β^p+1aRp+1

aTβ^aTβσ^aT(XTX)1atnp1.

В результате вы можете построить доверительные интервалы для любой линейной комбинации вектора используя то же распределение, которое вы используете для построения доверительного интервала для одной из координат.βt

В вашем случае и . Знаменатель в приведенной выше формуле является квадратным корнем того, что вы вычисляете как оценку стандартной ошибки (при условии, что это то, что вычисляет программное обеспечение ...). Обратите внимание, что оценщик дисперсии, , должен быть (обычным) объективным оценщиком, где вы делите на степени свободы, , а не на количество наблюдений .p=2aT=(0,x2x1,x22x12)σ^2np1n

NRH
источник
1
Спасибо, это именно то, что я искал. Но есть ли ошибка в формуле? Размеры не совпадают в . Должна ли иметь матрицу имеющую матрицы в первом столбце? aT(XTX)1aXn×(p+1)
mark999
@ mark999, да, имеет столбцов. Я исправил это в ответе. Спасибо. Xp+1
NRH