Я взял курс машинного обучения в моем колледже. В одной из викторин был задан этот вопрос.
Модель 1:
Модель 2:Какая из вышеперечисленных моделей подойдет для данных лучше? (предположим, что данные могут быть смоделированы с использованием линейной регрессии)
Правильный ответ (по словам профессора) заключается в том, что обе модели будут работать одинаково хорошо. Однако я считаю, что первая модель подойдет лучше.
Это причина моего ответа. Вторая модель, которую можно переписать как , , не будет такой же, как первая модель. самом деле α является параболой и, следовательно, имеет минимальное значение ( в данном случае ). Теперь из-за этого диапазон в первой модели больше, чем диапазон во второй модели. Следовательно , если данные были такими , что лучше всего подходит имел наклон меньше , вторая модель будет выполнять очень плохо , по сравнению с первым. Однако в случае, если наклон наилучшего соответствия был больше, чем , обе модели будут работать одинаково хорошо.
Так что, первый лучше или оба одинаковы?
Ответы:
Модель 2 может быть записана как: Это похоже на модель 1, но с другими обозначениями для гиперпараметров ( θ , β ). Тем не менее, для модели 1 можно записать θ = ( Х
Но так как в модели 2 мы имеем , что то , как вы упомянули , действительно диапазон р должен принадлежать [ - 0,25 , + ∞ ] для & thetas ∈ R . Что приведет к разнице в этих 2 моделях.
Таким образом , в модели 2 вы сдерживая свою оценку коэффициента в отличие от модели 1. Для того, чтобы сделать это более ясным, следует отметить , что в модели получается путем минимизации квадратичной функции потерь θ = Arg мин θ ∈ R ( у - X θ )θ^
Однако в модели 2 оценка получаетсяпомощью
& beta ; =Arg мин & beta ; ≥ - 0,25 (у-Х& beta)
источник
Не уверен, что понимаю ваши рассуждения. Если вы берете:
источник