Как вывести стандартную ошибку коэффициента линейной регрессии

20

Для этой одномерной модели линейной регрессии заданного набора данных оценки коэффициентов: Вот мой вопрос, согласно книга и Википедия , стандартная ошибка : Как и почему?

yi=β0+β1xi+ϵi
β 1 = Σ я х я у я - п ˉ х ˉ уD={(x1,y1),...,(xn,yn)} β 0= ˉ у - β 1 ˉ х
β^1=ixiyinx¯y¯nx¯2ixi2
β^0=y¯β^1x¯
β^1
sβ^1=iϵ^i2(n2)i(xix¯)2
авокадо
источник
@окрам, спасибо, но я не совсем справляюсь с матричными вещами, попробую.
авокадо
1
@окрам, я уже понимаю, как это получается. Но все же вопрос: в моем посте стандартная ошибка имеет (n2) , где, согласно вашему ответу, нет, почему?
Авокадо

Ответы:

15

3-й комментарий выше: я уже понимаю, как это происходит. Но все же вопрос: в моем посте стандартная ошибка имеет (n − 2), где, согласно вашему ответу, это не так, почему?


В моем сообщении что Знаменатель может быть записан как Таким образом,

se^(b^)=nσ^2nxi2(xi)2.
ni(xix¯)2
se^(b^)=σ^2i(xix¯)2

С то есть среднеквадратичной ошибкой (MSE) в таблице ANOVA, мы получим ваше выражение для . Член учитывает потерю 2 степеней свободы при оценке точки пересечения и наклона.

σ^2=1n2iϵ^i2
se^(b^)n2
ocram
источник
1
Я думаю, я получаю все остальное, ожидаю последнюю часть. Можете ли вы показать шаг за шагом, почему ? Я тоже знаю, что это связано со степенями свободы, но я не понимаю математику. σ^2=1n2iϵ^i2
Mappi
2

Другой способ думать о n-2 df состоит в том, что это потому, что мы используем 2 средства для оценки коэффициента наклона (среднее значение Y и X)

df из Википедии: "... Как правило, степени свободы оценки параметра равны количеству независимых оценок, которые входят в оценку, за вычетом количества параметров, используемых в качестве промежуточных шагов при оценке самого параметра. «.

Эйвинд
источник
2
Это не совсем вывод как таковой, хотя это интуиция. Для некоторых тонкостей, связанных с этим, см. Как понять степени свободы?
Серебряная рыбка