дисперсия в summary.glm ()

13

Я провел glm.nb по

glm1<-glm.nb(x~factor(group))

с группой, являющейся категориальной, и х, являющейся метрической переменной. Когда я пытаюсь получить сводку результатов, я получаю немного разные результаты, в зависимости от того, использую я summary()или summary.glm. summary(glm1)дает мне

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

тогда как summary.glm (glm1) дает мне

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Я понимаю значение параметра дисперсии, но не линии

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067),

В справочнике говорится, что это будет оценочная дисперсия, но, похоже, это неверная оценка, поскольку 0,95 не близко к 0,7109 или же оценочная дисперсия чем-то отличается от расчетного параметра дисперсии? Я предполагаю, что я должен установить дисперсию в чем- summary.nb(x, dispersion=)то, но я не уверен, если я должен установить дисперсию в 1 (что даст тот же результат, summary()или если я должен вставить оценку параметра дисперсии, в этом случае приводит к summary.nb(glm1, dispersion=0.7109)или что-то еще? Или я в порядке только с использованием summary(glm1)?

Ренуар Пулитц
источник
2
Используйте summary () при отправке в соответствующий метод S3 для класса negbin. Дисперсия, конечно, должна быть равна 1, что оценивается как тета, которую лучше назвать параметром формы, чтобы избежать путаницы. См. Также stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
Momo

Ответы:

13

summary.glm"negbin"summary.glmdispersionsummary.glm glmϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmна модели установлено glm.nb, в коде

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial"ϕsummary.negbin

ϕdispersion

Во-вторых, вы неправильно понимаете вывод. Когда ты видишь

Negative Binomial(0.7109)

θ^ϕ

ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

negbinφ

Восстановить Монику - Дж. Симпсон
источник
5
+1 Хорошее объяснение. У меня есть два небольших комментария: параметр дисперсии в биномиальном, пуассоновском и отрицательном биномах с известным параметром формы равен 1 по определению экспоненциального семейства (это не предположение). Когда вы говорите, что другая дисперсия может быть оценена и предоставлена ​​для суммарного метода, тогда нужно быть осторожным, потому что вы рискуете попасть на квази-территорию, что имеет последствия, особенно для вероятности.
Момо
@ Момо хорошо сказал. Я разрывался между тем, что вы заявляете, и деталями справочной страницы для соответствующих функций.
Восстановить Монику - Дж. Симпсон
2

θ1θ11θEYEμEμ

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

ожидание

EY=μ

& дисперсия

VarY=μ+μ2θ

Как указывает @Momo, параметр дисперсии - это совсем другая вещь, которую вы бы позволили варьировать для оценки квази-правдоподобия. Для отрицательной биномиальной модели и (истинной) модели Пуассона она справедливо установлена ​​в значение единица.

Scortchi - Восстановить Монику
источник