Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона?
Предположим следующий пример:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
Выход:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Я знаю, что уровень инцидентов для numberofdrugs
это exp(-0.023)=0.977
. Но как мне интерпретировать основные эффекты для фиктивных переменных?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
Gung - Восстановить Монику
источник
источник
Ответы:
Экспоненцируются
numberofdrugs
коэффициентом является мультипликативным термином, используемым для расчета оцененных ,healthvalue
когдаnumberofdrugs
увеличивается на 1 единицу. В случае категориальных (факторных) переменных возведенный в степень коэффициент представляет собой мультипликативный член относительно базового (первого фактора) уровня для этой переменной (поскольку R по умолчанию использует контрасты лечения). Этоexp(Intercept)
базовая ставка, и все остальные оценки будут относиться к ней.В вашем примере оценка
healthvalue
для кого-то с2
наркотиками,"placebo"
иimprovement=="none"
будет (с использованием сложения внутри опыта в качестве эквивалента умножения):В то время как кто - то на
4
наркотики,"treated"
и"some"
улучшение было бы , по оценкам ,healthvalue
вADDENDUM: Это то, что значит быть «добавкой в логарифмическом масштабе». «Добавка по шкале логарифмов» - это фраза, которую моя учительница Барбара Макнайт использовала, подчеркивая необходимость использования всех терминов-коэффициентов, которые применялись в логистической регрессии, при выполнении любого вида предсказания. Вы добавляете сначала все коэффициенты, умноженные на ковариатные значения, а затем возводите в степень. Способ возврата коэффициентов из объектов регрессии в R обычно заключается в использовании
coef()
функции экстрактора (выполненной с другой случайной реализацией ниже):Так что расчет сметы для субъекта с
4
наркотиками"treated"
при"some"
улучшении составит:И линейный предиктор для этого случая должен быть суммой:
Эти принципы должны применяться к любому пакету статистики, который возвращает таблицу коэффициентов пользователю. Метод и принципы более общие, чем может показаться из моего использования R.
Я копирую выбранные уточняющие комментарии, поскольку они «исчезают» на дисплее по умолчанию:
A: Коэффициенты - это натуральные логарифмы отношений. - DWin
A2: Нет. Если бы это была логистическая регрессия, то они были бы, но в регрессии Пуассона, где LHS - это число событий, а неявный знаменатель - это число, подверженное риску, тогда возведенные в степень коэффициенты являются «коэффициентами ставок» или «относительными рисками».
источник