Я нашел формулу для псевдо в книге Расширение линейной модели с помощью R, Джулиан Дж. Фарауэй (стр. 59).
Это общая формула для псевдо для GLM?
источник
Я нашел формулу для псевдо в книге Расширение линейной модели с помощью R, Джулиан Дж. Фарауэй (стр. 59).
Это общая формула для псевдо для GLM?
Существует большое количество псевдо- для GLiM. Отличный справочный сайт по статистике UCLA имеет полный обзор их здесь . Тот, который вы перечислите, называется псевдо- R ^ 2 Макфаддена . Относительно типологии UCLA, он похож на в том смысле, что он указывает улучшение улучшенной модели по сравнению с нулевой моделью. Некоторые статистические программы, в частности SPSS, если я правильно помню, распечатывают псевдо- R ^ 2 Макфаддена по умолчанию с результатами некоторых анализов, таких как логистическая регрессия, так что я подозреваю, что это довольно часто, хотя псевдо- R Кокса и Снелла и Нагелкерке ^ 2 с может быть даже больше. Однако псевдо- R ^ 2 Макфаддена не обладает всеми (нет псевдо- делает). Если кто-то заинтересован в использовании псевдо- для понимания модели, я настоятельно рекомендую прочитать эту прекрасную ветку резюме: какую меру псевдо- следует сообщить о логистической регрессии (Cox & Snell или Nagelkerke)? (Для чего это стоит, самого скользкий , чем люди понимают, большая демонстрацию , которую можно увидеть в @ whuber Ответит здесь: Is ? Полезно или опасно )
Colin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.
R дает нулевое и остаточное отклонение в выходных данных,
glm
так что вы можете сделать именно такое сравнение (см. Две последние строки ниже).Вы также можете извлечь эти значения из объекта с помощью
model$null.deviance
иmodel$deviance
источник
summary.glm
. Что касается того, является ли это определение общепринятым, потребовало бы некоторого вида обзора. Я бы сказал, что это не особенно редко, потому что я видел это раньше, но не то, что обязательно широко используется.Предложенная вами формула была предложена Maddala (1983) и Magee (1990) для оценки R в квадрате по логистической модели. Поэтому я не думаю, что это применимо ко всей модели glm (см. Книгу «Современные методы регрессии» Томаса П. Райана на странице 266).
Если вы сделаете ложный набор данных, вы увидите, что он недооценивает R в квадрате ... для гауссовского glm в каждом примере.
Я думаю, что для гауссовского GLM вы можете использовать базовую формулу (лм) R в квадрате ...
А для логистики (или биномиального семейства в r) я бы использовал предложенную вами формулу ...
До сих пор для Пуассона GLM я использовал уравнение из этого поста.
/programming/23067475/how-do-i-obtain-pseudo-r2-measures-in-stata-when-using-glm-regression
Существует также отличная статья о псевдо R2 доступна на исследовательских ворот ... вот ссылка:
https://www.researchgate.net/publication/222802021_Pseudo_R-squared_measures_for_Poisson_regression_models_with_over-_or_underdispersion
Я надеюсь, что это поможет.
источник
1-summary(GLM)$deviance/summary(GLM)$null.deviance
и вы увидите, что R2 соответствует значению R2 обычной регрессии OLS, поэтому приведенный выше ответ верен! Смотрите также мой пост здесь - stats.stackexchange.com/questions/412580/…Пакет R
modEvA
вычисляет D-Squared , как ,1 - (mod$deviance/mod$null.deviance)
как упомянуто Дэвид Дж ХаррисD-Squared или объясненное отклонение модели представлено в (Guisan & Zimmermann 2000) https://doi.org/10.1016/S0304-3800(00)00354-9
источник