Хорошая литература о перекрестной проверке

10

Кто-нибудь знает хорошую книгу / веб-страницу, чтобы начать изучать методы перекрестной проверки?

MarkDollar
источник

Ответы:

5

Если перекрестная проверка должна использоваться для выбора модели / функции, следует иметь в виду, что можно переопределить статистику перекрестной проверки и получить модель, которая работает плохо, и оптимизированную статистику перекрестной проверки. может быть очень оптимистичной оценкой производительности. Последствия этого могут быть удивительно большими. См. Ambroise и McLachlan для примера этого в настройке выбора функции и Cawley и Talbot для примера в настройке выбора модели.

Дикран Сумчатый
источник
Хорошо упомянуть об этом, но следует дважды сказать, что это примеры неправильного использования или чрезмерного использования CV, а не некоторые недостатки самого метода.
1
действительно, однако это способ, которым он довольно часто используется неправильно, поэтому важно знать об этом при изучении перекрестной проверки! Дополнительная перекрестная проверка часто является хорошим решением, то есть вложенной перекрестной проверки, или, как Стоун называет это «двойной перекрестной проверкой». Эта проблема в значительной степени затрагивает любой критерий выбора функции или модели, оптимизированный для получения модели; В этом смысле нет ничего особенного в перекрестной проверке.
Дикран Сумчатый
0

Я бы также порекомендовал перекрестную валидацию Паям Рафаилзаде, Лэй Тан и Хуан Лю.

Peter K.
источник