Я часто нахожу себя обучающим несколько различных прогностических моделей с использованием caret
R. Я тренирую их все по одним и тем же сгибам перекрестной проверки, используя caret::: createFolds
, а затем выбираю лучшую модель, основанную на перекрестно проверенной ошибке.
Тем не менее, медианный прогноз из нескольких моделей часто превосходит лучшую единственную модель в независимом наборе тестов. Я подумываю о том, чтобы написать некоторые функции для стекирования / ансамблирования каретных моделей, которые были обучены с одинаковыми сгибами перекрестной проверки, например, принимая срединные прогнозы из каждой модели в каждом сгибе или обучая «метамодель».
Конечно, для этого может потребоваться внешний цикл перекрестной проверки. Кто-нибудь знает какие-либо существующие пакеты / открытый исходный код для ансамбля каретных моделей (и, возможно, перекрестной проверки этих ансамблей)?
То, что вы ищете, называется "ансамбль моделей". Простое вводное руководство с кодом R можно найти здесь: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html
источник
Я не совсем уверен, что вы ищете, но это может помочь: http://www.jstatsoft.org/v28/i05/paper
Это как использовать несколько моделей в карете. Часть, которая может вас заинтересовать - это раздел 5 на стр. 13.
источник