Какая связь между регуляризацией и методом множителей Лагранжа?

12

Чтобы не допустить перегрузки людей, люди добавляют термин регуляризации (пропорциональный квадрату суммы параметров модели) с параметром регуляризации к функции стоимости линейной регрессии. Является ли этот параметр таким же, как множитель Лагранжа? Так регуляризация такая же, как метод множителя Лагранжа? Или как эти методы связаны? λλλ

asmaier
источник

Ответы:

11

Скажем, мы оптимизируем модель с параметрами , минимизируя некоторый критерий учетом ограничения на величину вектора параметров (например, для реализации подхода минимизации структурного риска путем построение вложенного набора моделей возрастающей сложности), нам необходимо решить: ; F( → & thetas ; )θf(θ)

minθf(θ)s.t.θ2<C

Лагранжиан для этой проблемы (предостережение: я думаю, это был длинный день ... ;-)

Λ(θ,λ)=f(θ)+λθ2λC.

Таким образом, легко увидеть, что регуляризованная функция стоимости тесно связана с проблемой оптимизации с ограничениями, причем параметр регуляризации связан с константой, управляющей ограничением ( ), и, по сути, является множителем Лагранжа. λC

Это иллюстрирует, почему, например, регрессия гребня реализует структурную минимизацию риска: Регуляризация эквивалентна наложению ограничения на величину вектора весов, и если то каждая модель, которая может быть сделана при соблюдении ограничения, котороеC1>C2

θ2<C2

также будет доступен под ограничением

θ2<C1 .

Следовательно, уменьшение порождает последовательность пространств гипотез возрастающей сложности.λ

Дикран Сумчатый
источник