CARET автоматически использует предварительно заданную сетку настройки для построения различных моделей перед выбором окончательной модели, а затем обучает окончательную модель полным данным обучения. Я могу предоставить свою собственную сетку настройки только с одной комбинацией параметров. Однако даже в этом случае CARET «выбирает» лучшую модель среди параметров настройки (даже если в этом случае есть только одна), а затем подгоняет окончательную модель ко всем данным обучения. Это дополнительный шаг, который я хотел бы избежать.
Как мне просто пропустить шаг поиска модели по вариациям сетки настройки и заставить CARET использовать все данные обучения (кроме прямого вызова базовой библиотеки моделей)?
Ответы:
Вы можете указать
method="none"
вtrainControl
. Например:Я не уверен, когда это было реализовано.
источник
Лучшим способом было бы явным образом предоставить фрейм данных tuneGrid. Например, случайный лес имеет только один параметр настройки, «mtry», который управляет количеством объектов, выбранных для каждого дерева.
Чтобы установить mtry на определенное значение, вы можете выбрать значение по умолчанию randomForest (? RandomForest) и сделать это:
где M - это единственное значение параметра настройки, которое вы хотите использовать.
для нескольких параметров настройки сделайте это:
источник
method="none"
является лучшим решением.Я не думаю, что это возможно (по крайней мере, это было невозможно по состоянию на несколько версий назад). Можно снизить влияние на производительность, настроив только один раздел повторной выборки в обучающих данных (но Caret все равно будет обучать модель дважды).
Это звучит как полезная функция, чтобы я пинговал автора пакета.
источник