В настоящее время я работаю над созданием прогнозирующей модели для двоичного результата на наборе данных с ~ 300 переменными и 800 наблюдениями. Я много читал на этом сайте о проблемах, связанных со ступенчатой регрессией, и почему бы не использовать ее.
Я изучал регрессию LASSO и ее способность выбирать функции и успешно реализовал ее с использованием пакета «caret» и «glmnet».
Я умею извлекать коэффициент модели с оптимальным lambda
и alpha
из "карета"; Однако я не знаю, как интерпретировать коэффициенты.
- Коэффициенты LASSO интерпретируются тем же методом, что и логистическая регрессия?
- Было бы целесообразно использовать функции, выбранные из LASSO, в логистической регрессии?
РЕДАКТИРОВАТЬ
Интерпретация коэффициентов, как в возведенных в степень коэффициентов из регрессии LASSO, в качестве логарифмов для изменения коэффициента на 1 единицу при сохранении всех остальных коэффициентов постоянными.
Ответы:
Позвольте мне перефразировать: интерпретируются ли коэффициенты LASSO таким же образом, как, например, коэффициенты максимального правдоподобия
OLSв логистической регрессии?LASSO (штрафной метод оценки) нацелен на оценку тех же величин (модельных коэффициентов), что и, скажем, максимальная вероятность
OLS(непенализованный метод). Модель такая же, а интерпретация остается прежней. Числовые значения от LASSO обычно отличаются от значений максимального правдоподобияOLS: некоторые будут ближе к нулю, другие будут точно равны нулю. Если было применено разумное количество штрафов, оценки LASSO будут лежать ближе к истинным значениям, чем оценки максимального правдоподобияOLS, что является желательным результатом.С этим нет никаких проблем, но вы можете использовать LASSO не только для выбора характеристик, но и для оценки коэффициентов. Как я упоминал выше, оценки LASSO могут быть более точными, чем, скажем, оценки максимального правдоподобия
OLS.источник