Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ С ИСПОЛЬЗОВАНИЕМ Рандомизации очень полезной, но в ней отсутствуют реальные графики, используемые для принятия решения. Надеюсь, кто-то с опытом может направить меня в правильном направлении.
Я хочу смоделировать распределение моей переменной ответа T, распределение которой приведено ниже. Как видите, это положительная асимметрия
.
У меня есть два категориальных фактора: МЕТ и CASEPART.
Обратите внимание, что это исследование в основном носит ознакомительный характер, по сути служит экспериментальным исследованием, прежде чем теоретизировать модель и выполнить DoE вокруг нее.
У меня есть следующие модели в R, с их диагностическими графиками:
LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)
GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))
GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))
Я также получил следующие P-значения с помощью теста Шапиро-Уилкса на остатки:
LM.LOG: 2.347e-11
GLM.GAMMA: 0.6288
GLM.GAUS: 0.6288
Я рассчитал значения AIC и BIC, но если я прав, они мало что мне говорят из-за разных семейств в GLM / LM.
Кроме того, я отметил крайние значения, но я не могу классифицировать их как выбросы, так как нет четкой «особой причины».
Ответы:
Ну, совершенно ясно, что логарифмическое соответствие Гауссу не подходит; есть сильная гетероскедастичность в остатках. Итак, давайте возьмем это из рассмотрения.
Осталось логнормально против гаммы.
Любая модель выглядит примерно одинаково подходящей в этом случае. Они оба имеют дисперсию, пропорциональную квадрату среднего значения, поэтому картина разброса остатков по сравнению с подгонкой аналогична.
Низкий выброс будет лучше соответствовать гамме, чем логарифмическому (наоборот, для высокого выброса). При данном среднем значении и дисперсии логнормальное значение является более искаженным и имеет более высокий коэффициент вариации.
Смотрите также здесь и здесь для некоторых связанных обсуждений.
источник