Я строю логистическую регрессию в R, используя метод LASSO с функциями cv.glmnet
для выбора lambda
и glmnet
для окончательной модели.
Я уже знаю все недостатки, связанные с автоматическим выбором модели, но мне все равно нужно это сделать.
Моя проблема в том, что мне нужно включить факторные (категориальные) переменные в модель, есть ли способ сделать это без создания большого количества фиктивных переменных? Это переменные почти все строки, а не числа.
Ответы:
glmnet не может принимать фактор напрямую, вам нужно преобразовать факторные переменные в пустышки. Это всего лишь один простой шаг с использованием model.matrix, например:
Альфа = 1 будет строить LASSO.
источник