http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Если вы посмотрите на верхнюю часть этого поста, автор упомянет, что норма L2 имеет уникальное решение, а норма L1, возможно, имеет много решений. Я понимаю это с точки зрения регуляризации, но не с точки зрения использования нормы L1 или нормы L2 в функции потерь.
Если вы посмотрите на графики функций скаляра x (x ^ 2 и | x |), вы легко увидите, что оба имеют одно уникальное решение.
regression
lasso
regularization
user3180
источник
источник
Ответы:
Рассмотрим одномерную задачу для максимально простого изложения. (Случаи более высоких размеров имеют схожие свойства.)
Поскольку (за исключением некоторых конкретных обстоятельств) у вас обычно нет такой гарантии отсутствия очень влиятельных наблюдений, я бы не назвал L1-регрессию надежной.
R код для участка:
источник
plot
. Ум взорван.Минимизация потерь L2 соответствует вычислению среднего арифметического, которое является однозначным, в то время как минимизация потерь L1 соответствует вычислению медианы, которая неоднозначна, если четное число элементов включено в вычисление медианы (см. Центральная тенденция: решения вариационных задач ).
источник