Вопросы с тегом «class-imbalance»

12
почему мы должны справиться с дисбалансом данных?

Мне нужно знать, почему мы должны бороться с дисбалансом данных. Я знаю, как с этим справляться, и различными методами для решения проблемы, которая заключается в повышении или понижении или использовании Smote. Например, если у меня редкое заболевание 1% из 100, и, скажем, я решил иметь...

11
Когда мы говорим, что набор данных не классифицируется?

Я много раз анализировал набор данных, по которому я не мог провести какую-либо классификацию. Чтобы увидеть, могу ли я получить классификатор, я обычно использовал следующие шаги: Создайте графические зависимости метки от числовых значений. Уменьшите размерность до 2 или 3, чтобы увидеть,...

10
Когда мы должны считать набор данных несбалансированным?

Я сталкиваюсь с ситуацией, когда количество положительных и отрицательных примеров в наборе данных несбалансировано. Мой вопрос заключается в том, есть ли какие-то практические правила, которые говорят нам, когда нам следует отбирать большую категорию, чтобы навязать некоторый баланс в наборе...

8
Категоризация подходов к работе с несбалансированными классами

Каков наилучший способ классификации подходов, разработанных для решения проблемы класса дисбаланса? Эта статья разделяет их на: Предварительная обработка: включает передискретизацию, недостаточную выборку и гибридные методы, Чувствительное к затратам обучение: включает в себя прямые методы и...