Эта статья использует обобщенные линейные модели (как биномиальное, так и отрицательное биномиальное распределение ошибок) для анализа данных. Но затем в разделе методов статистического анализа есть следующее утверждение:
... и, во-вторых, путем моделирования данных присутствия с использованием моделей логистической регрессии и данных о времени нагула с использованием обобщенной линейной модели (GLM). Отрицательное биномиальное распределение с функцией логарифмирования было использовано для моделирования данных о времени нагула (Welsh et al. 1996), а адекватность модели была проверена путем изучения результатов (McCullagh & Nelder 1989). Тесты Шапиро – Вилка или Колмогорова – Смирнова использовались для проверки нормальности в зависимости от размера выборки; данные были преобразованы логарифмически до анализа, чтобы придерживаться нормальности.
Если они принимают биномиальное и отрицательное биномиальное распределение ошибок, то, конечно, они не должны проверять нормальность остатков?
Ответы:
Обратите внимание, что отклонения отклонения (или Пирсона) не будут иметь нормального распределения, кроме гауссовой модели. Для случая логистической регрессии, как говорит @Stat, остатки отклонения для го наблюдения определяются какi yi
если &yi=0
если , где - вероятность Бернулли. Поскольку каждое из них может принимать только одно из двух значений, ясно, что их распределение не может быть нормальным даже для правильно определенной модели:yi=1 πi^
Но если существует повторяющихся наблюдений для го шаблона предиктора, & остаток отклонения определяется так, чтобы собрать ихni i
(где - теперь число успешных попыток от 0 до ), тогда, когда становится больше, распределение остатков приближается к норме:yi ni ni
То же самое происходит с пуассоновскими или отрицательными биномиальными GLM: для низких предсказанных подсчетов распределение остатков является дискретным и искаженным, но имеет тенденцию к нормальности для больших подсчетов в правильно заданной модели.
Это не обычно, по крайней мере, не в моей шее леса, чтобы провести формальную проверку остаточной нормальности; если тестирование нормальности по существу бесполезно, когда ваша модель предполагает точную нормальность, тогда тем более бесполезно, когда это не так. Тем не менее, для ненасыщенных моделей графическая остаточная диагностика полезна для оценки наличия и характера неадекватности, принимая нормальность с помощью щепотки или пригоршни соли в зависимости от количества повторений на шаблон предиктора.
источник
То, что они сделали, правильно! Я дам вам ссылку на двойную проверку. См. Раздел 13.4.4 в разделе « Введение в анализ линейной регрессии», 5-е издание.Дуглас С. Монтгомери, Элизабет А. Пек, Дж. Джеффри Вайнинг. В частности, посмотрите на примеры на странице 460, где они соответствуют биномиальному glm и дважды проверьте допущение нормальности «Остатки отклонения». Как упоминалось на странице 458, это происходит потому, что «остатки отклонения ведут себя так же, как обычные остатки в стандартной модели линейной регрессии нормальной теории». Так что имеет смысл, если вы строите их в обычном масштабе вероятности, а также против подгоночных значений. Снова смотрите страницу 456 вышеупомянутой ссылки. В примерах, которые они предоставили на стр. 460 и 461, не только для биномиального случая, но также для коэффициентов Пуассона и Gamma с (link = log), они проверили нормальность остатков отклонения.
Для биномиального случая остаток отклонения определяется как:
Проверьте здесь для случая Пуассона, а также.
источник