Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Я хочу знать, как интерпретировать оценку каждого параметра в таблице выше.
Ответы:
Я не думаю, что название вашего вопроса точно отражает то, что вы просите.
Вопрос о том, как интерпретировать параметры в GLM, очень широк, потому что GLM - очень широкий класс моделей. Напомним, что GLM моделирует переменную отклика которая, как предполагается, следует известному распределению из экспоненциального семейства, и что мы выбрали обратимую функцию g такую, что E [ yy g
для J переменных-предикторов x . В этой модели интерпретация любого конкретного параметра β j - это скорость изменения g ( y ) по отношению к x j . Определить μ ≡ E [ y
Что просто означает, что - это влияние на η единичного увеличения x j .βj η xj
Вы также можете указать отношения следующим образом: и E[y
Не зная ничего о , это насколько мы можем получить. β j - это влияние на η , на преобразованное условное среднее значение y единичного увеличения x j , а влияние на условное среднее y для единичного увеличения x j составляет g - 1 ( β ) .g βj η y xj y xj g−1(β)
Но вы, кажется, спрашиваете конкретно о регрессии Пуассона, используя стандартную функцию R по умолчанию, которая в данном случае является натуральным логарифмом. Если это так, вы спрашиваете о конкретном виде ГЖС , в которой и г = Ln . Тогда мы можем получить некоторую тягу в отношении конкретной интерпретации.y∼Poisson(λ) g=ln
Из того, что я сказал выше, мы знаем, что∂μ∂xj=dg−1dηβj . And since we know g(μ)=ln(μ) , we also know that g−1(η)=eη . We also happen to know that deηdη=eη , so we can say that
which finally means something tangible:
And using the more familiar unit change interpretation, we have:
There are three important pieces to note here:
So in your example, the effect of increasing pH by 1 is to increaselny^ by y^(e0.09−1) ; that is, to multiply y^ by e0.09≈1.09 . It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.
источник
My suggestion would be to create a small grid consisting of combinations of the two rivers and two or three values of each of the covariates, then use the
predict
function with your grid asnewdata
. Then graph the results. It is much clearer to look at the values that the model actually predicts. You may or may not want to back-transform the predictions to the original scale of measurement (type = "response"
).источник