Как я слышал о классификаторе AdaBoost, который неоднократно упоминался на работе, я хотел лучше понять, как он работает и когда его можно использовать. Я прочитал несколько статей и учебных пособий, которые я нашел в Google, но есть некоторые аспекты классификатора, которые я до сих пор не могу понять:
Большинство уроков, которые я видел, говорят об AdaBoost как о поиске наилучшей взвешенной комбинации из многих классификаторов. Это имеет смысл для меня. Что не имеет смысла, так это реализации (то есть MALLET), где AdaBoost, кажется, принимает только одного слабого ученика. Как это имеет смысл? Если AdaBoost предоставлен только один классификатор, не должен ли он просто вернуть тот же классификатор с весом 1? Как он производит новые классификаторы из первого классификатора?
Когда на самом деле захочется использовать AdaBoost? Я читал, что это должен быть один из лучших готовых классификаторов, но когда я попытался повысить классификатор MaxEnt, я получил f-баллы на 70% +, AdaBoost убил его и дал мне оценки около 15% с очень высокой степенью отзыва и очень низкой точностью. Так что теперь я в замешательстве. Когда я захочу использовать AdaBoost? Я ищу более интуитивный, а не строго статистический ответ, если это возможно.
источник