Изучая методы интеллектуального анализа данных, я понял, что существует две основные категории:
Прогнозные методы:
- классификация
- регрессия
Описательные методы:
- Кластеризация
- Правила ассоциации
Поскольку я хочу предсказать доступность (выход) пользователя на основе местоположения, активности, уровня заряда батареи (вход для модели обучения), я думаю, что очевидно, что я выбрал бы «Методы прогнозирования», но теперь я не могу выбирать между классификация и регрессия. Из того, что я понимаю, классификация может решить мою проблему, потому что вывод «доступен» или «недоступен».
Может ли классификация предоставить мне вероятность (или вероятность) того, что пользователь будет доступен или недоступен?
Поскольку в выводе не будет просто 0 (недоступно) или 1 (доступно), но это будет что-то вроде:
- доступно
- недоступно
Можно ли решить эту проблему с помощью регрессии?
Вы можете использовать наивную байесовскую классификацию и рассчитать апостериорные вероятности, используя предыдущие убеждения, или логистическую регрессию можно использовать с сигмовидной функцией.
источник