Я запустил линейную регрессию приема в колледж против баллов SAT и семейного / этнического происхождения. Данные являются вымышленными. Это продолжение предыдущего вопроса, на который уже дан ответ. Вопрос сосредоточен на сборе и интерпретации отношений шансов, оставляя оценки SAT в стороне для простоты.
Переменные Accepted
(0 или 1) и Background
(«красный» или «синий»). Я настроил данные так, чтобы люди с «красным» фоном могли с большей вероятностью попасть внутрь:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
Вопросов:
0,7 - это нечетное соотношение людей с "синим" фоном? Я спрашиваю об этом, потому что я также получаю 0,7 для "
Backgroundblue
", если вместо этого я запускаю следующий код:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
r
regression
logistic
Антони Пареллада
источник
источник
R
явно называется коэффициентами (через функциюcoef
), вы называете «отношением шансов» в своих выходных данных. Это говорит о том, что вы можете рассмотреть различие между ними.Ответы:
Я работаю над ответом на мой вопрос, вычисляя вручную соотношение шансов и шансов:
Таким образом, коэффициент вероятности попадания в школу Red over Blue:
И это
Backgroundred
возвращение:В то же время, он112 / 158 = 0,7089 ,
(Intercept)
соответствует числителю отношения шансов , которое в точности соответствует шансу семейного «голубого» фона:Если вместо этого я бегу:
Возвращение - это как раз шансы стать «синим»:
Backgroundblue
(0.7089), а шансы быть «красным»:Backgroundred
(1.7353). Там нет коэффициента шансов . Поэтому два возвращаемых значения не должны быть взаимными.Наконец, как прочитать результаты, если в категориальном регрессоре есть 3 фактора?
То же руководство по сравнению с [R] расчетом:
Я создал другой фиктивный набор данных с той же предпосылкой, но на этот раз было три этнических происхождения: «красный», «синий» и «оранжевый», и запустил ту же последовательность:
Во-первых, таблица непредвиденных расходов:
И рассчитали шансы на вхождение для каждой этнической группы:
А также различные коэффициенты шансов :
И продолжил теперь рутинную логистическую регрессию с последующим возведением в степень коэффициентов:
Прибавляя шансы на получение "блюза" как
(Intercept)
, и отношения шансов Orange против Blue вBackgroundorange
, и ИЛИ Red v Blue вBackgroundred
.С другой стороны, регрессия без перехвата предсказуемо вернула только три независимых коэффициента :
источник