У меня есть несколько тесно связанных вопросов относительно слабых учеников в обучении ансамблю (например, повышение).
- Это может показаться глупым, но каковы преимущества использования слабых по сравнению с сильными учениками? (например, почему бы не повысить с "сильными" методами обучения?)
- Есть ли какая-то «оптимальная» сила для слабых учеников (например, при сохранении всех остальных параметров ансамбля)? Есть ли «сладкое пятно», когда дело доходит до их силы?
- Как мы можем измерить силу слабого ученика относительно силы полученного метода ансамбля. Как мы можем количественно измерить предельные выгоды от использования ансамбля?
- Как мы сравниваем несколько слабых алгоритмов обучения, чтобы решить, какой из них использовать для данного метода ансамбля?
- Если данный метод ансамбля помогает слабым классификаторам больше, чем сильным, как мы можем сказать, что данный классификатор уже «слишком силен», чтобы приносить какие-либо существенные выгоды при его повышении?
machine-learning
boosting
ensemble
Амелио Васкес-Рейна
источник
источник
Во-первых, понятия «слабый» и «сильный» определены слабо. С моей точки зрения, они должны быть определены относительно оптимального байесовского классификатора, который является целью любого алгоритма обучения. Имея это в виду, я отвечаю на три пункта следующим образом.
источник