1) Как я могу изменить порог классификации (я думаю, он равен 0,5 по умолчанию) в RandomForest в sklearn?
2) как я могу пробовать в sklearn?
3) У меня есть следующий результат из классификатора RandomForest: [[1635 1297] [520 3624]]
precision recall f1-score support
class 0 0.76 0.56 0.64 2932
class 1 0.74 0.87 0.80 4144
в среднем 0,75 0,74 0,73 7076
Во-первых, данные не сбалансированы (30% из класса 0 и 70% из класса 1). Итак, я думаю, что классификатор с большей вероятностью будет смещен для класса 1, что означает перемещение некоторых из класса 0 в класс 1 (для класса 0 существует 1297 ошибок классификации, а для класса 1 - 520). Как я могу это исправить? может ли помочь понижающая выборка? или изменение порога классификации?
Обновление: класс 0 имеет 40% населения, в то время как класс 1 составляет 60%. Тем не менее, дрейф из класса 0 в класс 1 (1297) высок, в то время как я хочу, чтобы он стал низким.
источник
sample_weight
параметр (один вес на параметр), который очень гибок и позволяет имитироватьclass_weight
(один вес на целевой класс).y
? Почему у тебя разныеY
аy
?