Я пытаюсь понять, что является целью функции потери, и я не совсем понимаю ее.
Итак, насколько я понимаю, функция потерь предназначена для введения некоторой метрики, с помощью которой мы можем измерить «стоимость» неправильного решения.
Допустим, у меня есть набор данных из 30 объектов, я разделил их на наборы обучения / тестирования, например, 20/10. Я буду использовать функцию потерь 0-1, поэтому допустим, что мой набор меток классов равен M, а функция выглядит следующим образом. :
Итак, я построил некоторую модель на моих тренировочных данных, скажем, я использую наивный байесовский классификатор, и эта модель правильно классифицировала 7 объектов (присвоили им правильные метки классов), а 3 объекта были классифицированы неправильно.
Таким образом, моя функция потерь будет возвращать «0» 7 раз и «1» 3 раза - какую информацию я могу получить от этого? Что моя модель неправильно классифицировала 30% объектов? Или есть что-то еще?
Если в моем мышлении есть какие-то ошибки, мне очень жаль, я просто пытаюсь учиться. Если приведенный мной пример «слишком абстрактен», дайте мне знать, я постараюсь быть более конкретным. Если вы попытаетесь объяснить концепцию на другом примере, используйте функцию потери 0-1.
источник
Да, это в основном так: вы считаете количество ошибочно классифицированных предметов. За этим больше ничего нет, это очень простая функция потерь. Далее потеря 0-1 приводит к оценке режима распределения цели (по сравнению с потерей для оценки медианы и потерей L 2 для оценки среднего значения).L1 L2
источник
Я думаю, что ваша путаница не дифференцирует потерю для одной точки данных и потерю для всего набора данных.
источник