Я работаю над разработкой модели прогнозирования страхового риска. Эти модели относятся к «редким событиям», таким как прогнозирование неявки авиакомпаний, обнаружение неисправностей оборудования и т. Д. Когда я готовил свой набор данных, я пытался применить классификацию, но не смог получить полезные классификаторы из-за высокой доли отрицательных случаев. ,
У меня нет большого опыта в статистике и моделировании данных, кроме курса по статистике в старшей школе, поэтому я немного растерялся.
Сначала я думал об использовании неоднородной модели пуассоновского процесса. Я классифицировал его на основе данных о событиях (дата, широта, долгота), чтобы получить хорошую оценку вероятности риска в определенное время в определенный день в конкретном месте.
Я хотел бы знать, каковы методологии / алгоритмы для прогнозирования редких событий?
Что вы рекомендуете в качестве подхода к решению этой проблемы?