Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть идеи?
r
regression
random-forest
prediction
count-data
JEquihua
источник
источник
Ответы:
Существует пакет R, который называется
mobForest
реальным случайным лесом для данных подсчета. Он основан наmod()
( на основе модели рекурсивного разделения) вparty
пакете. Он выполняет регрессию Пуассона, еслиfamily
аргумент указан какpoisson()
. Пакета больше нет в репозитории CRAN, но ранее доступные версии можно получить из архива.Если вы не ограничены случайным лесом / расфасовкой, для данных подсчета также доступна улучшающая версия. То есть
gbm
(обобщенные модели регрессии с усилением). Это может также соответствовать модели Пуассона.источник
Я вижу несколько возможностей.
источник
Ну, это не случайный лес, но CatBoost поддерживает функцию потери пуассона, которую можно использовать для регрессии подсчета с повышенными деревьями:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/
источник