Из «Введения в статистическое обучение » Джеймса и др., Оценка перекрестной проверки (LOOCV) определяется как где .
Без доказательства уравнение (5.2) утверждает, что для регрессии наименьших квадратов или полиномиальной регрессии (относится ли это к регрессии только по одной переменной, мне неизвестно), где " это й встроенна значение из первоначальных наименьших квадратов не подходит ( не знаю , что это значит, кстати , означает ли это с использованием всех точек в наборе данных?) и является кредитное плечо» , которое определяетсягяячячя=1
Как это доказать?
Моя попытка: можно начать с того, что заметили, что но отдельно из этого (и если я напомню, что формула для верна только для простой линейной регрессии ...), я не уверен, как действовать дальше.чя
источник
Ответы:
Я покажу результат для любой множественной линейной регрессии, независимо от того, являются ли регрессоры полиномами от или нет. На самом деле, он показывает немного больше, чем вы просили, потому что он показывает, что каждый остаток LOOCV идентичен соответствующему взвешенному остатку из полной регрессии, а не только тому, что вы можете получить ошибку LOOCV, как в (5.2) (там Могут быть и другие способы, которыми средние значения совпадают, даже если не каждый термин в среднем одинаков).ИксT
Позвольте мне позволить себе использовать слегка адаптированные обозначения.
Сначала мы покажем, что где - оценка, использующая все данные, и оценка при выходе из , наблюдение . Пусть определяется как вектор строки, такой что . - остатки.(А) & beta ; & beta ; (т)Х(т)тХт у т=Хт & beta ; у т
В доказательстве используется следующий матричный алгебраический результат.
Пусть - неособая матрица, - вектор и - скаляр. Если Тогда b λ λA б λ (A+λbb')-1
Доказательство (B) следует непосредственно из проверки
Следующий результат полезен для доказательства (A)
Доказательство (C): По (B) мы имеем, используя , Таким образом, мы находим ( X ′ ( t ) X ( t ) ) - 1ΣTт = 1Икс'TИксT= X'Икс (X ′ ( t ) X(t))-1X ′ t
Доказательство (A) теперь следует из (C): так как мы имеем или Итак, где последнее равенство следует из (С).( Х ' ( т ) Х ( т ) + Х ' т Х т ) β
Теперь обратите внимание на . Умножьте в (A) на , добавьте с обеих сторон и переставьте, чтобы получить остатки, полученные в результате использования ( ), иличасT= XT( X'Икс)- 1Икс'T ИксT YT U^( т ) β^( т ) YT- ХTβ^( т )
источник