Логистическая регрессия в R (отношение шансов)

41

Я пытаюсь провести анализ логистической регрессии в R. Я посещал курсы по этому материалу с использованием STATA. Мне очень трудно копировать функциональность в R. Это зрелый в этой области? Там, кажется, мало документации или руководства доступны. Кажется, что для получения отношения шансов требуется установка epicalcи / или epitoolsи / или другие, ни один из которых я не могу приступить к работе, устарел или не имеет документации. Я привык glmделать логистическую регрессию. Любые предложения будут приветствоваться.

Я бы лучше сделал это реальным вопросом. Как я могу провести логистическую регрессию и получить соотношение шансов R?

Вот что я сделал для одномерного анализа:

x = glm(Outcome ~ Age, family=binomial(link="logit"))

И для многомерного:

y = glm(Outcome ~ Age + B + C, family=binomial(link="logit"))

Я посмотрел на x, y, summary(x)и summary(y).

Имеет ли x$coefficientsкакое-либо значение?

SabreWolfy
источник

Ответы:

36

если вы хотите интерпретировать оценочные эффекты как относительные отношения шансов, просто сделайте exp(coef(x))(дает вам , мультипликативное изменение отношения шансов для y = 1, если ковариата, связанная с β, увеличивается на 1). Для интервалов вероятности профиля для этого количества, вы можете сделатьеβYзнак равно1β

require(MASS)
exp(cbind(coef(x), confint(x)))  

РЕДАКТИРОВАТЬ: @ Каракал был быстрее ...

фабианцы
источник
1
+1 за предложение @ fabian. Уступает способ сделать это , что , как правило , дает аналогичные интервалы, чтобы вычислить интервал на шкале логита , а затем преобразовать в масштаб шансов: cbind( exp(coef(x)), exp(summary(x)$coefficients[,1] - 1.96*summary(x)$coefficients[,2]), exp(summary(x)$coefficients[,1] + 1.96*summary(x)$coefficients[,2]) ). Существует также дельта-метод: ats.ucla.edu/stat/r/faq/deltamethod.htm
lockedoff
42

Вы правы в том, что выходные данные R обычно содержат только существенную информацию, и больше нужно рассчитывать отдельно.

N  <- 100               # generate some data
X1 <- rnorm(N, 175, 7)
X2 <- rnorm(N,  30, 8)
X3 <- abs(rnorm(N, 60, 30))
Y  <- 0.5*X1 - 0.3*X2 - 0.4*X3 + 10 + rnorm(N, 0, 12)

# dichotomize Y and do logistic regression
Yfac   <- cut(Y, breaks=c(-Inf, median(Y), Inf), labels=c("lo", "hi"))
glmFit <- glm(Yfac ~ X1 + X2 + X3, family=binomial(link="logit"))

coefficients()дает оценочные параметры регрессии . Хотя проще интерпретировать e x p ( b j ) (кроме перехвата).бJеИксп(бJ)

> exp(coefficients(glmFit))
 (Intercept)           X1           X2           X3 
5.811655e-06 1.098665e+00 9.511785e-01 9.528930e-01

Чтобы получить отношение шансов, нам нужна таблица классификации исходного дихотомического DV и прогнозируемая классификация в соответствии с некоторым порогом вероятности, который должен быть выбран первым. Вы также можете увидеть функцию ClassLog()в пакете QuantPsyc(как упоминалось в смежном вопросе ).

# predicted probabilities or: predict(glmFit, type="response")
> Yhat    <- fitted(glmFit)
> thresh  <- 0.5  # threshold for dichotomizing according to predicted probability
> YhatFac <- cut(Yhat, breaks=c(-Inf, thresh, Inf), labels=c("lo", "hi"))
> cTab    <- table(Yfac, YhatFac)    # contingency table
> addmargins(cTab)                   # marginal sums
     YhatFac
Yfac   lo  hi Sum
  lo   41   9  50
  hi   14  36  50
  Sum  55  45 100

> sum(diag(cTab)) / sum(cTab)        # percentage correct for training data
[1] 0.77

Для отношения шансов вы можете использовать пакет vcdили выполнить расчет вручную.

> library(vcd)                       # for oddsratio()
> (OR <- oddsratio(cTab, log=FALSE)) # odds ratio
[1] 11.71429

> (cTab[1, 1] / cTab[1, 2]) / (cTab[2, 1] / cTab[2, 2])
[1] 11.71429

> summary(glmFit)  # test for regression parameters ...

# test for the full model against the 0-model
> glm0 <- glm(Yfac ~ 1, family=binomial(link="logit"))
> anova(glm0, glmFit, test="Chisq")
Analysis of Deviance Table
Model 1: Yfac ~ 1
Model 2: Yfac ~ X1 + X2 + X3
  Resid. Df Resid. Dev Df Deviance P(>|Chi|)    
1        99     138.63                          
2        96     110.58  3   28.045 3.554e-06 ***
каракал
источник
2
Спасибо - мне нужно внимательно просмотреть ваш ответ. В STATA можно просто запускать logitи logisticполучать коэффициенты шансов и доверительные интервалы легко. Я несколько разочарован тем, что это кажется настолько сложным и нестандартным R. Могу ли я использовать exp(cbind(coef(x), confint(x)))ответ Фабиана ниже, чтобы получить ОД и КИ? Мне не понятно, что дает ваш ответ?
SabreWolfy
3
cTabеИксп(бJ)еИксп(бJ)ИксJ
4
на самом деле @SabreWolfy меня расстраивает то, что люди могут нажимать одну кнопку в stata / sas / spss и т. д., и получать коэффициенты шансов (вставить статистику соответствия, тип III SS, что вам нравится здесь), не имея понятия о том, что это значит / как рассчитать его / имеет ли он смысл в конкретной ситуации / и (возможно, что еще более важно), не имея практического знания самого языка.
Rawr
23

На странице статистики UCLA есть хороший обзор выполнения логистической регрессии в R. Она включает в себя краткий раздел по вычислению коэффициентов шансов.

Герцог ящериц
источник
2
К сожалению, эта ссылка мертва
Дэн Чалтиэль
6
К счастью, Интернет (не всегда) не забывает: web.archive.org/web/20110319043907/http://www.ats.ucla.edu/stat/…
snoram
5

Пакет epiDisplay делает это очень легко.

library(epiDisplay)
data(Wells, package="carData")
glm1 <- glm(switch~arsenic+distance+education+association, 
            family=binomial, data=Wells)
logistic.display(glm1)
Logistic regression predicting switch : yes vs no 

                       crude OR(95%CI)         adj. OR(95%CI)         P(Wald's test) P(LR-test)
arsenic (cont. var.)   1.461 (1.355,1.576)     1.595 (1.47,1.731)     < 0.001        < 0.001   

distance (cont. var.)  0.9938 (0.9919,0.9957)  0.9911 (0.989,0.9931)  < 0.001        < 0.001   

education (cont. var.) 1.04 (1.021,1.059)      1.043 (1.024,1.063)    < 0.001        < 0.001   

association: yes vs no 0.863 (0.746,0.999)     0.883 (0.759,1.027)    0.1063         0.1064    

Log-likelihood = -1953.91299
No. of observations = 3020
AIC value = 3917.82598
Эдвард
источник
Есть ли способ совместить логистический дисплей с латексной оберткой, как outregили xtable?
Авторитетный Мисномер