Вопросы с тегом «dummy-variable»

112
Как заставить R использовать указанный факторный уровень в качестве ссылки в регрессии?

Как я могу сказать R использовать определенный уровень в качестве эталона, если я использую двоичные независимые переменные в регрессии? Просто по умолчанию используется какой-то уровень. lm(x ~ y + as.factor(b)) с b {0, 1, 2, 3, 4}. Скажем, я хочу использовать 3 вместо нуля, который используется...

92
Какие плюсы и минусы между get_dummies (Pandas) и OneHotEncoder (Scikit-learn)?

Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummiesметод и sklearn.preprocessing.OneHotEncoder()хотел посмотреть, чем они отличаются по производительности и использованию. Я нашел руководство по...