Рассмотрим входную матрицу и двоичный выход .
Распространенным способом измерения производительности классификатора является использование кривых ROC.
На графике ROC диагональ - это результат, который можно получить из случайного классификатора. В случае несбалансированного выходного сигнала производительность случайного классификатора можно улучшить, выбрав или с различными вероятностями.
Как можно представить производительность такого классификатора на графике кривой ROC? Я полагаю, это должна быть прямая линия с другим углом, а не диагональ больше?
Ответы:
Кривые ROC нечувствительны к балансу классов. Прямая линия, которую вы получаете для случайного классификатора, уже является результатом использования различных вероятностей получения положительного результата (0 приводит вас к (0, 0), а 1 - к (1, 1) с любым промежуточным диапазоном).
Ничего не меняется в несбалансированной обстановке.
источник