Регрессия только с категориальными переменными

24

Можно ли провести регрессию, если все зависимые и независимые переменные являются категориальными переменными?

альтруист
источник
3
Это, конечно, возможно, даже для обычной или садовой регрессии, при условии, что ответная (зависимая) переменная обрабатывается чисто численно. В зависимости от вашего программного обеспечения вам может потребоваться подтолкнуть или заставить это произойти. При достаточно широком определении регрессии, включая логистическую или порядковую регрессию, это не только возможно, но и является обычным делом.
Ник Кокс

Ответы:

31

Мы должны уточнить наши условия здесь, но в целом, да :

  • Если ваша зависимая переменная является непрерывной (а остатки обычно распределены - см. Здесь ), но все ваши независимые переменные являются категориальными, это просто ANOVA .
  • Если ваша зависимая переменная является категориальной, а ваши независимые переменные являются непрерывными, это будет логистическая регрессия (возможно, двоичная, порядковая или многочленная , в зависимости).
  • Если и ваша зависимая переменная, и ваши независимые переменные являются категориальными переменными, вы все равно можете использовать логистическую регрессию - это своего рода версия LOV ANOVA.

Обратите внимание, что как логистическая регрессия, так и обычная наименьших квадратов (линейная) регрессия являются частными случаями обобщенной линейной модели .

Gung - Восстановить Монику
источник
Это третий случай, который вы упомянули, я попробовал LR, ни один из коэффициентов не был признан значимым. Я подумал, что могу сделать что-то не так.
альтруист
2
Я не думаю, что ANOVA требует непрерывной зависимой переменной больше, чем требует нормально распределенных невязок. Это просто условия, при которых ANOVA, как ожидается, будет хорошо работать.
Ник Кокс
1
@NickCox, ты прав, конечно; мы спорим о том, как мы определяем и применяем эти термины. Я бы сказал, что модель основана на этих предположениях, но ANOVA можно использовать, даже если они не выполняются, с вопросом о том, будут ли результаты полезными в зависимости.
gung - Восстановить Монику
1
@altruist, я изложил три случая для концептуальной ясности; Я признаю, что последнее, что вы хотите. Обратите внимание, что правильно ли вы используете программное обеспечение, чтобы соответствовать модели, и являются ли ваши коэффициенты «значимыми», не связано с тем, является ли LR подходящей моделью для вашей ситуации.
gung - Восстановить Монику
4
Обратите внимание, что категоричность иногда является вопросом определения для программного обеспечения, а иногда и в уме зрителя. Какое количество детей, например?
Ник Кокс