Мой главный вопрос касается попыток понять, как k-кратная перекрестная проверка подходит в контексте наличия наборов обучения / проверки / тестирования (если это вообще подходит в таком контексте).
Обычно люди говорят о разделении данных на набор для обучения, валидации и тестирования, скажем, с соотношением 60/20/20 на курс Эндрю Нга, посредством чего набор валидации используется для определения оптимальных параметров для обучения модели.
Однако, если кто-то хотел использовать перекрестную проверку в k-кратном выражении в надежде получить более репрезентативную меру точности, когда объем данных является относительно небольшим, то, что делает перекрестная проверка в k-кратном порядке, влечет за собой именно это разделение 60/20/20 сценарий?
Например, будет ли это означать, что мы на самом деле объединим обучающий и тестовый наборы (80% данных) и проведем к-кратную перекрестную проверку на них, чтобы получить меру точности (фактически отказавшись от наличия явного «набора тестирования»)? Если да, то какую обученную модель мы используем a) в производстве и b) использовать в сравнении с проверочным набором и определить оптимальные параметры обучения? Например, один из возможных ответов для a и b, возможно, заключается в использовании модели наилучшего сгиба.
Разделение на обучение / валидацию / тестирование также является стратегией выборки.
Вы можете заменить обучение / валидацию другой стратегией отбора проб. Затем вы должны выполнить кратное CV на 80% данных и протестировать на оставшиеся 20%.K
Вы также можете применить его к части тестирования (это то, что люди называют вложенной перекрестной проверкой), где сгибы используются для обучения / проверки, а оставшаяся часть - для проверки, затем вы повторяете это сгибами.K−1
источник