У меня есть следующий результат от запуска функции GLM.
Как я могу интерпретировать следующие значения:
- Нулевое отклонение
- Остаточное отклонение
- AIC
Они имеют какое-то отношение к совершенству? Могу ли я рассчитать некоторую степень достоверности соответствия по этим результатам, таким как R-квадрат или любая другая мера?
Call:
glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 +
as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.52628 -0.24781 -0.02916 0.25581 0.48509
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept -1.305e-01 1.391e-01 -0.938 0.3482
tmpData$X1 -9.999e-01 1.059e-03 -944.580 <2e-16 ***
tmpData$X2 -1.001e+00 1.104e-03 -906.787 <2e-16 ***
tmpData$X3 -5.500e-03 3.220e-03 -1.708 0.0877 .
tmpData$X4 -1.825e-05 2.716e-05 -0.672 0.5017
tmpData$X5 1.000e+00 5.904e-03 169.423 <2e-16 ***
tmpData$X6 1.002e+00 1.452e-03 690.211 <2e-16 ***
tmpData$X7 6.128e-04 3.035e-04 2.019 0.0436 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for gaussian family taken to be 0.08496843)
Null deviance: 109217.71 on 3006 degrees of freedom
Residual deviance: 254.82 on 2999 degrees of freedom
(4970 observations deleted due to missingness)
AIC: 1129.8
Number of Fisher Scoring iterations: 2
Ответы:
Семейство ошибок по умолчанию дляр2 р2 р2
glm
модели на (языке) R - гауссовское, поэтому с представленным кодом вы получаете обычную линейную регрессию, где - это общепринятая мера «соответствия требованиям». Функция R сообщает не Nagelkerke-псевдо-" R 2 ", а AIC (критерий информации Akaike). В случае модели OLS показатель GOF Нагелкерке будет примерно таким же, как и для R 2 .glm
Есть некоторые споры о том, как интерпретировать такую меру на LHS, но только когда модели отклоняются от более простой ситуации Гаусса / OLS. Но в GLM, где функция связи может не быть «идентичностью», как было здесь, и «квадратичная ошибка» может не иметь такой же четкой интерпретации, поэтому также сообщается информационный критерий Акаике, поскольку он представляется более общим. В лотереях GLM GOF есть несколько других претендентов без явного победителя.
источник
Используйте Нулевое Отклонение и Остаточное Отклонение, а именно:
Если вы думаете об этом, вы пытаетесь измерить отношение отклонения в вашей модели к нулю; насколько лучше ваша модель (остаточное отклонение), чем просто пересечение (нулевое отклонение). Если это соотношение крошечное, вы «объясняете» большую часть отклонений в нуле; 1 минус, который дает вам ваш R-квадрат.
В вашем случае вы получите 0,998.
Если вы просто вызовете линейную модель (lm) вместо glm, это явно даст вам R-квадрат в сводке, и вы увидите, что это то же самое число.
источник
Если вы работаете с бинарной логистической моделью, вы также можете запустить тест Hosmer Lemeshow Goodness of Fit для вашей модели glm (). Использование библиотеки ResourceSelection.
источник
family = "binomial
. Пример OP - линейная регрессия.hoslem.test()