Как правильно указывают другие ответы, сообщенные вероятности из таких моделей, как логистическая регрессия и наивный байесовский анализ, являются оценками вероятности класса. Если бы модель была верной, вероятность действительно была бы вероятностью правильной классификации.
Тем не менее, очень важно понимать, что это может вводить в заблуждение, потому что модель оценивается и, следовательно, не является правильной моделью. Есть как минимум три вопроса.
- Неопределенность оценок.
- Неверная спецификация модели.
- Bias.
Неопределенность как раз везде присутствует факт , что вероятность является лишь приблизительным. Доверительный интервал предполагаемой вероятности класса может дать некоторое представление о неопределенности (вероятности класса, а не классификации).
--
Если процедура оценки (намеренно) дает необъективную оценку , вероятности класса ошибочны. Это то, что я вижу в методах регуляризации, таких как лассо и ридж для логистической регрессии. В то время как перекрестно проверенный выбор регуляризации приводит к модели с хорошими характеристиками в плане классификации, вероятности результирующего класса явно недооцениваются (слишком близко к 0,5) в тестовых случаях. Это не обязательно плохо, но важно осознавать.