Вопросы с тегом «categorical-data»

112
Как заставить R использовать указанный факторный уровень в качестве ссылки в регрессии?

Как я могу сказать R использовать определенный уровень в качестве эталона, если я использую двоичные независимые переменные в регрессии? Просто по умолчанию используется какой-то уровень. lm(x ~ y + as.factor(b)) с b {0, 1, 2, 3, 4}. Скажем, я хочу использовать 3 вместо нуля, который используется...

86
Панды: преобразование категорий в числа

Предположим, у меня есть фрейм данных со странами, который выглядит так: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако я хочу вместо этого преобразовать их в индексы, чтобы получить cc_index =...

10
Преобразовать несколько категориальных столбцов

В моем наборе данных у меня есть два категориальных столбца, которые я хотел бы перечислить. Оба столбца содержат страны, некоторые перекрываются (отображаются в обоих столбцах). Я хотел бы дать одно и то же число в столбцах 1 и 2 для одной и той же страны. Мои данные выглядят примерно так: import...