Доказательство формулы LOOCV

18

Из «Введения в статистическое обучение » Джеймса и др., Оценка перекрестной проверки (LOOCV) определяется как где .

резюме(N)знак равно1NΣязнак равно1NMSEя
MSEязнак равно(Yя-Y^я)2

Без доказательства уравнение (5.2) утверждает, что для регрессии наименьших квадратов или полиномиальной регрессии (относится ли это к регрессии только по одной переменной, мне неизвестно), где " это й встроенна значение из первоначальных наименьших квадратов не подходит ( не знаю , что это значит, кстати , означает ли это с использованием всех точек в наборе данных?) и является кредитное плечо» , которое определяетсягяячячя=1

резюме(N)знак равно1NΣязнак равно1N(Yя-Y^я1-чася)2
Y^яячася
часязнак равно1N+(Икся-Икс¯)2ΣJзнак равно1N(ИксJ-Икс¯)2,

Как это доказать?

Моя попытка: можно начать с того, что заметили, что но отдельно из этого (и если я напомню, что формула для верна только для простой линейной регрессии ...), я не уверен, как действовать дальше.чя

Y^язнак равноβ0+Σязнак равно1КβКИксК+некоторые полиномиальные члены степени 2
чася
Кларнетист
источник
Либо ваши уравнения, кажется, используют для более чем одной вещи, или я сильно запутался. В любом случае дополнительная ясность будет хорошей. я
Glen_b
@Glen_b Я только что узнал о LOOCV вчера, поэтому я не могу правильно понять некоторые вещи. Насколько я понимаю, у вас есть набор точек данных, скажем, . С LOOCV у вас есть для каждого фиксированного (положительного целого) некоторый набор проверки и тестовый набор используется для генерации подобранной модели для каждого . Например, мы подгоняем нашу модель, используя простую линейную регрессию с тремя точками данных, . Мы бы (продолжение следует)k V k = { ( x k , y k ) } T k = XV k k X = { ( 0 , 1 ) , ( 1 , 2 ) , ( 2 , 3 ) }Иксзнак равно{(Икся,Yя):яZ+}КВКзнак равно{(ИксК,YК)}TКзнак равноИксВККИксзнак равно{(0,1),(1,2),(2,3)}
Кларнетист
@Glen_b и . Используя точки в , мы можем обнаружить, что с помощью простой линейной регрессии мы получаем модель . Затем мы вычисляем используя в качестве набора проверки, и получаем (просто используя заданную точку) и , давая . Хорошо, возможно, использование верхнего индекса не было лучшей идеей - я изменю это в оригинальном посте. Т 1 ={(1,2),(2,3)} Т 1 г я =Х+1СКО V 1 у 1 =1 у ( 1 ) 1 =0+1=1 MSE 1 =0В1знак равно{(0,1)}T1знак равно{(1,2),(2,3)}T1Y^язнак равноИкс+1MSEВ1Y1знак равно1Y^1(1)знак равно0+1знак равно1MSE1знак равно0
Кларнетист
вот несколько лекционных заметок на страницах
Ксавье Бурре Сикот

Ответы:

17

Я покажу результат для любой множественной линейной регрессии, независимо от того, являются ли регрессоры полиномами от или нет. На самом деле, он показывает немного больше, чем вы просили, потому что он показывает, что каждый остаток LOOCV идентичен соответствующему взвешенному остатку из полной регрессии, а не только тому, что вы можете получить ошибку LOOCV, как в (5.2) (там Могут быть и другие способы, которыми средние значения совпадают, даже если не каждый термин в среднем одинаков).ИксT

Позвольте мне позволить себе использовать слегка адаптированные обозначения.

Сначала мы покажем, что где - оценка, использующая все данные, и оценка при выходе из , наблюдение . Пусть определяется как вектор строки, такой что . - остатки.(А) & beta ; & beta ; (т)Х(т)тХт у т=Хт & beta ; у т

β^-β^(T)знак равно(U^T1-часT)(Икс'Икс)-1ИксT',(А)
β^β^(T)Икс(T)TИксTY^Tзнак равноИксTβ^U^T

В доказательстве используется следующий матричный алгебраический результат.

Пусть - неособая матрица, - вектор и - скаляр. Если Тогда b λ λAбλ (A+λbb')-1

λ-1б'A-1б
(A+λбб')-1знак равноA-1-(λ1+λб'A-1б)A-1бб'A-1(В) 

Доказательство (B) следует непосредственно из проверки

{A-1-(λ1+λб'A-1б)A-1бб'A-1}(A+λбб')знак равноя,

Следующий результат полезен для доказательства (A)

(Икс(T)'Икс(T))-1ИксT'знак равно(11-часT)(Икс'Икс)-1ИксT', (С)

Доказательство (C): По (B) мы имеем, используя , Таким образом, мы находим ( X ( t ) X ( t ) ) - 1ΣTзнак равно1TИксT'ИксTзнак равноИкс'Икс(X( t ) X(t))-1Xt

(Икс(T)'Икс(T))-1знак равно(Икс'Икс-ИксT'ИксT)-1знак равно(Икс'Икс)-1+(Икс'Икс)-1ИксT'ИксT(Икс'Икс)-11-ИксT(Икс'Икс)-1ИксT',
(Икс(T)'Икс(T))-1ИксT'знак равно(Икс'Икс)-1ИксT'+(Икс'Икс)-1ИксT'(ИксT(Икс'Икс)-1ИксT'1-ИксT(Икс'Икс)-1ИксT')знак равно(11-часT)(Икс'Икс)-1ИксT',

Доказательство (A) теперь следует из (C): так как мы имеем или Итак, где последнее равенство следует из (С).( Х ' ( т ) Х ( т ) + Х ' т Х т ) β

Икс'Иксβ^знак равноИкс'Y,
(Икс(T)'Икс(T)+ИксT'ИксT)β^знак равноИкс(T)'Y(T)+ИксT'YT,
{яК+(Икс(T)'Икс(T))-1ИксT'ИксT}β^знак равноβ^(T)+(Икс(T)'Икс(T))-1ИксT'(ИксTβ^+U^T),
β^знак равноβ^(T)+(Икс(T)'Икс(T))-1ИксT'U^Tзнак равноβ^(T)+(Икс'Икс)-1ИксT'U^T1-часT,

Теперь обратите внимание на . Умножьте в (A) на , добавьте с обеих сторон и переставьте, чтобы получить остатки, полученные в результате использования ( ), или часTзнак равноИксT(Икс'Икс)-1ИксT'ИксTYTU^(T)β^(T)YT-ИксTβ^(T)

U^(T)знак равноU^T+(U^T1-часT)часT
U^(T)знак равноU^T(1-часT)+U^TчасT1-часTзнак равноU^T1-часT
Кристоф Ханк
источник
Определение отсутствует в вашем ответе. Я предполагаю, что это матрица с удаленной строкой . Икс(T)ИксИксT
mpiktas
Также упомянуть тот факт, что будет полезным. Икс'Иксзнак равноΣTзнак равно1TИксT'ИксT
mpiktas
@mpiktas, да, спасибо за указатели. Я отредактировал, чтобы принять во внимание первый комментарий. Где именно вторая помощь? Или просто оставить это в своем комментарии?
Кристоф Ханк,
3
Когда вы начинаете доказательство (C), вы пишете . Это хороший трюк, но я сомневаюсь, что случайный читатель знает об этом. (Икс(T)'Икс(T))-1знак равно(Икс'Икс-ИксT'ИксT)-1
mpiktas
1
Два года спустя ... я ценю этот ответ еще больше, теперь, когда я прошел последовательность линейных моделей на уровне выпускника. Я переучиваю этот материал с этой новой точки зрения. Есть ли у вас какие-либо предлагаемые ссылки (учебники?), Которые проходят деривации, как то, что у вас есть в этом ответе в деталях?
Кларнетист