У меня проблема с 6 классами. Поэтому я строю мультиклассовый классификатор следующим образом: для каждого класса у меня есть один классификатор логистической регрессии, использующий один против всех, что означает, что у меня есть 6 различных классификаторов.
Я могу сообщить матрицу путаницы для каждого из моих классификаторов. Но я хотел бы сообщить матрицу путаницы для ВСЕХ классификаторов, как я видел во многих примерах здесь.
Как мне это сделать? Нужно ли менять стратегию классификации, используя алгоритм «Один против одного» вместо «Один против всех»? Потому что на этих матрицах путаницы в отчетах говорится о ложных срабатываниях для каждого класса.
Пример мультиклассовой матрицы путаницы
Я хотел бы найти количество неправильно классифицированных предметов. В первом ряду 137 примеров класса 1, которые были классифицированы как класс 1, и 13 примеров класса 1, которые были классифицированы как класс 2 . Как получить этот номер?
Ответы:
Предположительно, вы используете эти классификаторы, чтобы помочь выбрать один конкретный класс для данного набора значений признаков (как вы сказали, вы создаете мультиклассовый классификатор).
Это просто прямое расширение матрицы смешения 2-х классов.
источник
Хотя на этом форуме уже есть ответы, я решил дать четкие уравнения, чтобы сделать его более определенным:
Элементы путаницы для каждого класса определяются как:
источник
Используя матрицу, прикрепленную в вопросе, и рассматривая значения по вертикальной оси как фактический класс, а значения по горизонтальной оси - как прогноз. Тогда для класса 1:
137
-> образцы класса 1, классифицированные как класс 16
-> (1 + 2 + 4) выборки классов 2, 3 и 4, но классифицированные как класс 118
-> (13 + 3 + 1 + 1) выборки класса 1, но классифицируются как классы 2, 3, 6 и 7581
-> (55 + 1 + 6 ... + 2 + 26) Сумма всех значений в матрице, кроме значений в столбце 1 и строке 1источник