Вопросы с тегом «overdispersion»

Чрезмерная дисперсия - это когда существует большая изменчивость, чем «должно» быть в данных. Например, дисперсия подсчетов часто больше среднего, тогда как дисперсия Пуассона должна равняться среднему.

44
Существует ли тест для определения значимости избыточной дисперсии GLM?

Я создаю пуассоновские GLM в R. Чтобы проверить избыточную дисперсию, я смотрю на отношение остаточного отклонения к степеням свободы, предоставляемым summary(model.name). Есть ли предельное значение или критерий для того, чтобы это соотношение считалось "значительным"? Я знаю, что если это> 1,...

32
Как мне соответствовать многоуровневой модели для перераспределенных результатов по пуассону?

Я хочу установить многоуровневый GLMM с распределением Пуассона (с избыточной дисперсией), используя R. В настоящее время я использую lme4, но я заметил, что недавно quasipoissonсемейство было удалено. В другом месте я видел, что вы можете моделировать аддитивную избыточную дисперсию для...

30
Что такое квазибиномиальное распределение (в контексте GLM)?

Я надеюсь, что кто-то может дать интуитивный обзор того, что такое квазибиномиальное распределение и что оно делает. Меня особенно интересуют эти моменты: Чем квазибиномиал отличается от биномиального распределения. Когда переменная отклика представляет собой пропорцию (примерные значения включают...

16
Стратегия выбора подходящей модели для подсчета данных

Какова подходящая стратегия для решения, какую модель использовать с данными подсчета? У меня есть данные подсчета, которые мне нужно моделировать как многоуровневые модели, и мне (на этом сайте) было рекомендовано, что лучший способ сделать это - через ошибки или MCMCglmm. Однако я все еще пытаюсь...

16
Пуассон или квази пуассон в регрессии с данными подсчета и избыточной дисперсией?

У меня есть данные подсчета (анализ спроса / предложения с подсчетом количества клиентов, в зависимости от - возможно - многих факторов). Я пробовал линейную регрессию с нормальными ошибками, но мой QQ-график не очень хорош. Я попробовал лог-преобразование ответа: еще раз плохой QQ-сюжет. Итак,...

16
Когда кто-то говорит, что для модели Пуассона остаточное отклонение / df должно составлять ~ 1, насколько приблизительным является приблизительное значение?

Я часто видел советы по проверке того, является ли подход Пуассона более рассредоточенным, включая деление остаточного отклонения на степени свободы. Результирующее соотношение должно быть «примерно 1». Вопрос в том, о каком диапазоне мы говорим о «приблизительном» - каково соотношение, которое...

15
Моделирование распределения Пуассона с избыточной дисперсией

У меня есть набор данных, который я ожидаю, чтобы следовать распределению Пуассона, но он разбросан примерно в 3 раза. В настоящее время я моделирую эту избыточную дисперсию, используя что-то вроде следующего кода в R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med)...

15
Являются ли тесты на избыточную дисперсию в GLM действительно * полезными *?

Феномен «чрезмерной дисперсии» в GLM возникает всякий раз, когда мы используем модель, которая ограничивает дисперсию переменной отклика, и данные демонстрируют большую дисперсию, чем позволяет ограничение модели. Это обычно происходит при моделировании данных подсчета с использованием Poisson GLM,...

14
Сверхдисперсия в логистической регрессии

Я пытаюсь понять концепцию чрезмерной дисперсии в логистической регрессии. Я читал, что избыточная дисперсия - это когда наблюдаемая дисперсия переменной отклика больше, чем можно было бы ожидать от биномиального распределения. Но если биномиальная переменная может иметь только два значения (1/0),...

12
Параметрическое моделирование дисперсии данных счета

Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить,...

12
Как проверить избыточную дисперсию в пуассоновском GLMM с помощью lmer () в R?

У меня есть следующая модель: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... и это сводный результат. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare +...

12
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями

Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в...

12
Одинаковые коэффициенты, оцениваемые в модели Пуассона и Квази-Пуассона

При моделировании данных подсчета претензий в страховой среде я начал с Пуассона, но затем заметил чрезмерную дисперсию. Квази-Пуассон лучше моделировал большее отношение средней дисперсии, чем основной Пуассон, но я заметил, что коэффициенты были идентичны как в модели Пуассона, так и в модели...

12
Как бороться с чрезмерной дисперсией в пуассоновской регрессии: квази-правдоподобие, отрицательный биномиальный GLM или случайный эффект на уровне субъекта?

Я натолкнулся на три предложения по поводу чрезмерной дисперсии в переменной отклика Пуассона и стартовой модели с фиксированными эффектами: Используйте квази-модель; Используйте отрицательный биномиальный GLM; Используйте смешанную модель со случайным эффектом на уровне объекта. Но какой на самом...

10
Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...

9
Как glmnet справляется с избыточной дисперсией?

У меня есть вопрос о том, как смоделировать текст поверх данных подсчета, в частности, как я могу использовать эту lassoтехнику для сокращения возможностей. Скажем, у меня есть N онлайн статей и количество просмотров страниц для каждой статьи. Я извлек 1-грамм и 2-грамм для каждой статьи, и я хотел...