Я использую R и анализирую свои данные с помощью GLM с биноминальной ссылкой.
Я хочу знать, что означает перехват в выходной таблице. Перехват для одной из моих моделей существенно отличается, однако переменная - нет. Что это значит?
Что такое перехват? Я не знаю, просто ли я запутываю себя, но, обыскав Интернет, я ничего не могу сказать, это так, примите это к сведению ... или нет.
Пожалуйста, помогите, очень расстроенный студент
glm(formula = attacked_excluding_app ~ treatment, family = binomial,
data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3548 0.3593 0.3593 0.3593 0.3593
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.708 1.033 2.622 0.00874 **
treatmentshiny_non-shiny 0.000 1.461 0.000 1.00000
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963 on 31 degrees of freedom
Residual deviance: 14.963 on 30 degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
r
generalized-linear-model
Сэмюэл Уолдрон
источник
источник
Ответы:
Член перехвата - это перехват в линейной части уравнения GLM, поэтому для вашей средней модели используется , где g - ваша функция связи, а X β - ваша линейная модель. Эта линейная модель содержит «член перехвата», то есть:Е[ Y] = г- 1( X β) грамм X β
В вашем случае перехват значительно ненулевой, а переменная - нет, поэтому он говорит, что
Поскольку ваша функция ссылки является биномиальной, то
И поэтому, используя только термин «перехват», ваша подходящая модель для среднего значения:
Вы можете видеть, что если то это соответствует просто 50:50 вероятности получить Y = 1 или 0, то есть E [ Y ] = 1с = 0 Е[ Y] = 11 + 1= 0,5
Итак, ваш результат говорит, что вы не можете предсказать результат, но один класс (1 или 0) более вероятен, чем другой.
источник
Мне кажется, что с данными могут быть проблемы. Странно, что оценка параметра для коэффициента будет 0,000. Похоже, что ваш DV и ваш IV являются дихотомическими, и что пропорции вашего DV не меняются в зависимости от вашего IV. Это правильно?
Перехват, как я отметил в своем комментарии (и, как подразумевает ответ @corone), является значением DV, когда IV равен 0. Как был кодирован ваш IV? Как, впрочем, тот факт, что оценка для коэффициента составляет 0,000, подразумевает, что IV не имеет значения.
источник
В вашем случае перехват - это среднее значение
attacked_excluding_app
, рассчитанное для всех данных независимо отtreatment
. Тест значимости в таблице коэффициентов проверяет, значительно ли он отличается от нуля. Уместно ли это, зависит от того, есть ли у вас априорная причина ожидать, что он будет нулевым или нет.Например, представьте, что вы проверили препарат и плацебо на их влияние на кровяное давление. Для каждого субъекта вы записываете изменение их кровяного давления путем расчета (давление после лечения - давление до лечения) и рассматриваете это как зависимую переменную в своем анализе. Затем вы обнаружите, что эффект от лечения (лекарство против плацебо) незначителен, но перехват значительно> 0 - это говорит о том, что в среднем артериальное давление ваших пациентов повышалось между двумя измерениями. Это может быть интересно и требует дальнейшего изучения.
источник