Можно ли рассчитать значения AIC или BIC для моделей лассо-регрессии и других регуляризованных моделей, где параметры только частично входят в уравнение. Как определить степени свободы?
Я использую R для подбора моделей регрессии Лассо с помощью glmnet()
функции из glmnet
пакета, и я хотел бы знать, как рассчитать значения AIC и BIC для модели. Таким образом, я мог бы сравнить значения с моделями, подходящими без регуляризации. Возможно ли это сделать?
Ответы:
Вы также можете найти следующие документы, представляющие интерес:
источник
Я много боролся с тем, как рассчитать AIC и BIC для моделей glmnet. Однако после долгих поисков я нашел ответ на третьей странице Google. Это можно найти здесь . Я публикую его здесь для будущих читателей, так как считаю, что не могу быть единственным.
В итоге я реализовал AIC и BIC следующим образом:
источник
В ссылке, на которую ссылается johnnyheineken, автор заявляет:
Мне кажется, что если вы сравниваете AIC между двумя моделями, тот факт, что вы не можете отделить нулевое отклонение, не должен иметь значения. Поскольку он существует по обеим сторонам неравенства, он показывает, какая модель должна иметь более низкую AIC. Это зависит от двух вещей:
источник