Каков наилучший способ классификации подходов, разработанных для решения проблемы класса дисбаланса?
Эта статья разделяет их на:
- Предварительная обработка: включает передискретизацию, недостаточную выборку и гибридные методы,
- Чувствительное к затратам обучение: включает в себя прямые методы и мета-обучение, которые последние делят на пороговые значения и выборку,
- Методы ансамбля: включает в себя чувствительные к стоимости ансамбли и предварительную обработку данных в сочетании с обучением ансамблю.
Вторая классификация:
- Предварительная обработка данных: включает изменение распределения и взвешивание пространства данных. Одноклассное обучение рассматривается как изменение распределения.
- Специальные методы обучения
- Постобработка прогноза: включает пороговый метод и постобработку с учетом затрат
- Гибридные методы:
Третья статья :
- Методы уровня данных
- Методы уровня алгоритма
- Гибридные методы
Последняя классификация также рассматривает корректировку выпуска как независимый подход.
Заранее спасибо.
Ответы:
На мой взгляд, все три классификации во многом совпадают. Например, все три имеют категорию для этапов предварительной обработки.
Я бы, как правило, согласился с третьей категоризацией как с более общей и охватывающей больше вещей.
Единственное, чего не хватает в первых двух статьях, - это этапы постобработки, которые, честно говоря, не используются на практике так часто, как другие.
источник