Я часто вижу людей, говорящих о перекрестной проверке 5x2 как частном случае вложенной перекрестной проверки .
Я предполагаю, что первое число (здесь: 5) относится к числу сгибов во внутренней петле, а второе число (здесь: 2) относится к числу сгибов во внешней петле? Итак, чем это отличается от «традиционного» подхода к выбору и оценке моделей? Под "традиционным" я имею в виду
- разбить набор данных на отдельную тренировку (например, 80%) и тестовый набор
- используйте перекрестную проверку в k-кратном порядке (например, k = 10) для настройки гиперпараметра и выбора модели на тренировочном наборе
- оценить эффективность обобщения выбранной модели, используя набор тестов
Разве 5x2 не одинаковы, за исключением того, что тестовый и тренировочный набор имеют одинаковый размер, если k = 2?
Ответы:
5x2cv, насколько я видел в литературе, всегда относится к 5-тикратному повторению. Нет вложенности вообще. сделайте 2 раза (50/50 деление между поездом и тестом), повторите это еще 4 раза. 5x2cv был популяризирован в статье Приблизительные статистические тесты для сравнения контролируемых алгоритмов обучения классификации Dietterich как способ получения не только хорошей оценки ошибки обобщения, но также и хорошей оценки дисперсии этой ошибки (для выполнения статистических тестов). )
источник
2 повторения во внешнем цикле означают, что вы повторяете свое 5-кратное резюме 2 раза на всем наборе поездов. Каждый раз деление на складки будет разным.
Это в основном используется для лучшей оценки производительности модели, например, при проведении статистических тестов на предмет того, работает ли одна модель статистически-значительно лучше, чем другая.
Вложенное резюме не является критически важным, если ваш набор данных большой и без выбросов. Если у ваших данных есть выбросы, то эффективность перекрестной проверки может существенно отличаться в зависимости от того, в каких сгибах / сгибах находятся эти выбросы. Поэтому вы повторяете CV несколько раз.
источник