Правильное правило подсчета очков - это правило, которое максимизируется «истинной» моделью, и оно не позволяет «хеджировать» или разыгрывать систему (преднамеренно сообщая о различных результатах, как и истинное убеждение модели в улучшении оценки). Оценка Бриера правильная, точность (пропорция классифицирована правильно) неуместна и часто не рекомендуется. Иногда я вижу, что AUC называют полусобственным правилом оценки, что делает его не совсем поддельным, но и менее чувствительным, чем правильные правила (например, здесь /stats//a/90705/53084 ).
Что означает полусобственное правило подсчета очков? Это где-то определено?
Ответы:
Давайте начнем с примера. Скажем, Алиса - тренер по треку и хочет выбрать спортсмена, который будет представлять команду на предстоящем спортивном соревновании - 200-метровом спринте. Естественно, она хочет выбрать самого быстрого бегуна.
Хотя приведенный выше пример несколько упрощен, он показывает, что происходит с использованием правил оценки. Алиса предсказывала ожидаемое время спринта. В контексте классификации мы прогнозируем вероятности, минимизируя погрешность вероятностного классификатора.
Как мы видим, полусобственное правило подсчета очков не является идеальным, но оно также не является катастрофическим. Это может быть весьма полезно во время предсказания! Cagdas Ozgenc имеет отличный пример здесь , где работает с неподходящим / полу-надлежащего правила предпочтительнее строго надлежащего правила. В общем, термин « полу-правильное правило оценки» встречается не очень часто. Это связано с неправильными правилами, которые, тем не менее, могут быть полезны (например, AUC-ROC или MAE в вероятностной классификации).
Наконец, обратите внимание на что-то важное. Как спринт связан с сильными ногами, так и правильная вероятностная классификация с точностью. Маловероятно, что у хорошего спринтера будут слабые ноги, и вряд ли у хорошего классификатора будет плохая точность. Тем не менее, приравнивание точности с хорошими характеристиками классификатора похоже на приравнивание силы ног с хорошими показателями в спринте. Не совсем необоснованно, но очень правдоподобно, чтобы привести к бессмысленным результатам.
источник