Методы повторного отбора карета

20

Я использую библиотеку caretв R для тестирования различных процедур моделирования.

trainControlОбъект позволяет указать метод повторной дискретизации. Эти методы описаны в документации разделе 2.3 , и включают в себя: boot, boot632, cv, LOOCV, LGOCV, repeatedcvи oob. Хотя некоторые из них легко вывести, не все эти методы четко определены.

Какие процедуры соответствуют этим методам повторной выборки?

Рам Ахлувалия
источник
ссылка на документацию не работает. Используйте это вместо этого.
Викас

Ответы:

20

Хорошо, вот моя попытка:

mpiktas
источник
1
Я считаю, что LGOCV - это случайное разбиение между обучающим набором и проверочным набором, повторяемое n раз. Таким образом, вместо обычного случая разделения данных между поездом и удержанием (построение модели на поезде и проверка на удержание) один раз, этот процесс повторяется много раз.
B_Miner
3
Я также полагаю, что повторный CV - это k-кратная перекрестная проверка, выполненная несколько раз.
B_Miner
Трудно поверить, что это нигде не задокументировано.
Андрей
4

repeatedcvПовторяется 10-кратная кросс-проверка наверняка, согласно презентации Max Куна. Схема повторной выборки по умолчанию является начальной загрузкой.

Хорошим файлом, который вы можете посмотреть о методах пересэмплирования, является Predictive Modeling с R и пакетом каретки ( pdf ). Макс представил это в «useR! 2013».

tigergopro
источник