Почему ? (Одна переменная линейная регрессия)

14

Примечание. = сумма квадратов, = сумма квадратов ошибок и = регрессионная сумма квадратов. Уравнение в названии часто записывается как:SSTSSESSR

i=1n(yiy¯)2=i=1n(yiy^i)2+i=1n(y^iy¯)2

Довольно простой вопрос, но я ищу интуитивное объяснение. Интуитивно, мне кажется, что будет иметь больше смысла. Например, предположим, что точка имеет соответствующее значение y и \ hat y_i = 3 , где \ hat y_i - соответствующая точка на линии регрессии. Также предположим, что среднее значение y для набора данных равно \ bar y = 0 . Тогда для этой конкретной точки i SST = (5-0) ^ 2 = 5 ^ 2 = 25 , а SSE = (5-3) ^ 2 = 2 ^ 2 = 4 и SSR = (3-0) ^ 2 = 3 ^ 2 = 9 . Очевидно, 9 + 4 <25 . Разве этот результат не будет распространяться на весь набор данных? Я не понимаюSSTSSE+SSRxiг я = 3 у я ˉ у = 0 S S Т = ( 5 - 0 ) 2 = 5 2 = 25 S S Е = ( 5 - 3 ) 2 = 2 2 = 4 S Syi=5y^i=3y^iy¯=0SST=(50)2=52=25SSE=(53)2=22=4SSR=(30)2=32=99+4<25

кулачок
источник

Ответы:

15

Сложение и вычитание дает Итак, нам нужно показать, что n i = 1

i=1n(yiy¯)2=i=1n(yiy^i+y^iy¯)2=i=1n(yiy^i)2+2i=1n(yiy^i)(y^iy¯)+i=1n(y^iy¯)2
. Запись п Σ я = 1 ( у я - у я ) ( у я - ˉ у ) = п Σ я = 1 ( у я - у я ) у я - ° уi=1n(yiy^i)(y^iy¯)=0 Таким образом, (а) остаткиея=уя - у ядолжен быть ортогонален подобранными значениями,Σ п я = 1 (уя - у I) у я=0, и (б) сумму подогнанных потребностей значенийкоторые будут равны сумме зависимой переменной,Σ п я = 1 гI
i=1n(yiy^i)(y^iy¯)=i=1n(yiy^i)y^iy¯i=1n(yiy^i)
ei=yiy^ii=1n(yiy^i)y^i=0 .i=1nyi=i=1ny^i

На самом деле, я думаю , что (а) легче показать в матричной форме для общей множественной регрессии которых единичный случай переменного является частным случаем: А (б), производная функции критерия МНК относительно постоянной (! Таквам нужен в регрессии для этогочтобы быть правдой), иначе нормальное уравнение , является SSR

eXβ^=(yXβ^)Xβ^=(yX(XX)1Xy)Xβ^=y(XX(XX)1XX)β^=y(XX)β^=0
который может быть измененчтобы Еяуя=п & alpha ; + & beta ; Еяхя правая часть этого уравнениявидимомутакже являетсяΣ п я = 1 у я, как и у я= α
SSRα^=2i(yiα^β^xi)=0,
iyi=nα^+β^ixi
i=1ny^iy^i=α^+β^xi
Кристоф Ханк
источник
3

SST=SSR+SSE

SST) with one explanatory variable, X, then there are exactly two sources of variability. First, there is the variability captured by X (Sum Square Regression), and second, there is the variability not captured by X (Sum Square Error). Hence, SST=SSR+SSE (exact equality).

(2) Geometric intuition

Please see the first few pictures here (especially the third): https://sites.google.com/site/modernprogramevaluation/variance-and-bias

Some of the total variation in the data (distance from datapoint to Y¯) is captured by the regression line (the distance from the regression line to Y¯) and error (distance from the point to the regression line). There's not room left for SST to be greater than SSE+SSR.

(3) The problem with your illustration

You can't look at SSE and SSR in a pointwise fashion. For a particular point, the residual may be large, so that there is more error than explanatory power from X. However, for other points, the residual will be small, so that the regression line explains a lot of the variability. They will balance out and ultimately SST=SSR+SSE. Of course this is not rigorous, but you can find proofs like the above.

Also notice that regression will not be defined for one point: b1=(XiX¯)(YiY¯)(XiX¯)2, and you can see that the denominator will be zero, making estimation undefined.

Hope this helps.

--Ryan M.

RMurphy
источник
1

When an intercept is included in linear regression(sum of residuals is zero), SST=SSE+SSR.

prove

SST=i=1n(yiy¯)2=i=1n(yiy^i+y^iy¯)2=i=1n(yiy^i)2+2i=1n(yiy^i)(y^iy¯)+i=1n(y^iy¯)2=SSE+SSR+2i=1n(yiy^i)(y^iy¯)
Just need to prove last part is equal to 0:
i=1n(yiy^i)(y^iy¯)=i=1n(yiβ0β1xi)(β0+β1xiy¯)=(β0y¯)i=1n(yiβ0β1xi)+β1i=1n(yiβ0β1xi)xi
In Least squares regression, the sum of the squares of the errors is minimized.
SSE=i=1n(ei)2=i=1n(yiyi^)2=i=1n(yiβ0β1xi)2
Take the partial derivative of SSE with respect to β0 and setting it to zero.
SSEβ0=i=1n2(yiβ0β1xi)1=0
So
i=1n(yiβ0β1xi)1=0
Take the partial derivative of SSE with respect to β1 and setting it to zero.
SSEβ1=i=1n2(yiβ0β1xi)1xi=0
So
i=1n(yiβ0β1xi)1xi=0
Hence,
i=1n(yiy^i)(y^iy¯)=(β0y¯)i=1n(yiβ0β1xi)+β1i=1n(yiβ0β1xi)xi=0
SST=SSE+SSR+2i=1n(yiy^i)(y^iy¯)=SSE+SSR

DavidCruise
источник