Я просто понял, что у меня всегда работала проблема регрессии, где независимые переменные всегда были числовыми. Могу ли я использовать линейную регрессию в случае, когда все независимые переменные являются категориальными?
источник
Я просто понял, что у меня всегда работала проблема регрессии, где независимые переменные всегда были числовыми. Могу ли я использовать линейную регрессию в случае, когда все независимые переменные являются категориальными?
Просто немного семантики и поясним:
Таким образом, в большинстве ситуаций тип регрессии зависит от типа зависимой, исходной или переменной . Например, линейная регрессия используется, когда зависимая переменная является непрерывной, логистическая регрессия, когда зависимая является категориальной с 2 категориями, и многочленная (n) регрессия, когда зависимая является категориальной с более чем 2 категориями. Предикторами могут быть все что угодно (номинальное или порядковое категориальное, или непрерывное, или сочетание) .
(Примечание ниже может быть излишним для вас, но я все равно добавлю его)
Тем не менее, обратите внимание, что большинство программного обеспечения требует, чтобы вы перекодировали категориальные предикторы в двоичную числовую систему . Это просто означает кодирование пола до 0 для женщин и 1 для мужчин или наоборот. Для категориальных переменных с более чем 2 уровнями вам необходимо перекодировать их в фиктивные переменные где - это количество уровней, и эти фиктивные переменные содержат 0 или 1, когда они находятся в соответствующей категории. Таким образом, каждый человек (образец) должен быть представлен наличием 1 для фиктивной переменной, частью которой он / она является, и 0 для остальных или 0 для всех манекенов, когда он / она является частью контрольной группы.л