Я пытаюсь понять, когда использовать случайный эффект, а когда он не нужен. Мне сказали, что эмпирическое правило, если у вас есть 4 или более групп / отдельных лиц, которые я делаю (15 отдельных лосей). Некоторые из этих лосей были эксперименты 2 или 3 раза в общей сложности 29 испытаний. Я хочу знать, ведут ли они себя по-разному, когда они находятся в ландшафтах с более высоким риском, чем нет. Итак, я думал, что установлю индивидуальность как случайный эффект. Тем не менее, мне сейчас говорят, что нет необходимости включать человека в качестве случайного эффекта, потому что в его ответной реакции не так много различий. Что я не могу понять, так это как проверить, действительно ли что-то учитывается при определении индивидуума как случайного эффекта. Может быть, первоначальный вопрос: Какой тест / диагностику я могу сделать, чтобы выяснить, является ли Individual хорошей объяснительной переменной и должен ли это быть фиксированный эффект - qq plots? гистограмм? разброс участков? И что бы я искал в этих шаблонах.
Я запускал модель с отдельным человеком как случайный эффект и без него, но затем я прочитал http://glmm.wikidot.com/faq, где они утверждают:
не сравнивайте модели lmer с соответствующими подгонками lm или glmer / glm; логарифмические правдоподобия несоизмеримы (т. е. они включают разные аддитивные термины)
И здесь я предполагаю, что это означает, что вы не можете сравнить модель со случайным эффектом или без него. Но я все равно не знаю, что мне следует сравнивать между ними.
В моей модели со случайным эффектом я также пытался посмотреть на результат, чтобы увидеть, какое свидетельство или значение имеет RE
lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv)
Linear mixed model fit by maximum likelihood
Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID)
Data: tv
AIC BIC logLik deviance REMLdev
-13.92 -7.087 11.96 -23.92 15.39
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 0.00000 0.00000
Residual 0.02566 0.16019
Number of obs: 29, groups: ID, 15
Fixed effects:
Estimate Std. Error t value
(Intercept) 3.287e-01 5.070e-02 6.483
D.CPC.min -1.539e-03 3.546e-04 -4.341
FD.CPC 1.153e-04 1.789e-05 6.446
Correlation of Fixed Effects:
(Intr) D.CPC.
D.CPC.min -0.010
FD.CPC -0.724 -0.437
Вы видите, что мое отклонение и SD от индивидуального идентификатора как случайный эффект = 0. Как это возможно? Что означает 0? Это правильно? Тогда мой друг, который сказал: «Поскольку нет никакого изменения, использующего ID, поскольку случайный эффект не нужен», верно? Так, тогда я бы использовал это как фиксированный эффект? Но разве тот факт, что существует так мало различий, не означает, что он все равно ничего нам не скажет?
Ответы:
Оценка,
ID
дисперсия = 0, указывает на то, что уровень изменчивости между группами недостаточен для включения случайных эффектов в модель; то есть. Ваша модель вырождена.Как вы правильно идентифицируете себя: скорее всего, да;
ID
как случайный эффект не нужен. Мало что приходит на ум, чтобы проверить это предположение:REML = F
всегда) AIC (или ваш любимый IC в целом) между моделью со случайными эффектами и без них и посмотреть, как это происходит.anova()
вывод двух моделей.Имейте в виду, что у вариантов 1 и 2 есть проблема: вы проверяете что-то, что находится на границах пространства параметров, так что на самом деле они не являются технически обоснованными. Сказав это, я не думаю, что вы получите неправильное представление о них, и многие люди используют их (например, Дуглас Бейтс, один из разработчиков lme4, использует их в своей книге, но четко заявляет, что предостережение о значениях параметров проверяется на границе множества возможных значений). Вариант 3 является самым утомительным из 3, но на самом деле дает вам лучшее представление о том, что происходит. Некоторые люди испытывают искушение использовать непараметрическую загрузку также, но я думаю, что с учетом того факта, что вы делаете параметрические предположения, чтобы начать с вас, можно также использовать их.
источник
lme4
особенно сейчас, когда он неmcmcsamp()
работает, и у людей остается только собственная реализация самозагрузки, чтобы получить приличные p-значения и т. Д.Я не уверен, что подход, который я собираюсь предложить, является разумным, поэтому те, кто знает больше об этой теме, поправляют меня, если я ошибаюсь.
Мое предложение состоит в том, чтобы создать дополнительный столбец в ваших данных, который имеет постоянное значение 1:
Затем вы можете создать модель, которая использует этот столбец в качестве случайного эффекта:
На этом этапе вы можете сравнить (AIC) вашу исходную модель со случайным эффектом
ID
(давайте назовем этоfm0
) с новой моделью, которая не учитывает,ID
посколькуIDconst
она одинакова для всех ваших данных.Обновить
user11852 просил привести пример, потому что, по его / ее мнению, вышеупомянутый подход даже не будет выполнен. Напротив, я могу показать, что подход работает (по крайней мере, с тем,
lme4_0.999999-0
что я сейчас использую).Выход:
Согласно этому последнему тесту, мы должны сохранить случайный эффект, так как
fm0
модель имеет самый низкий AIC и BIC.Обновление 2
Кстати, этот же подход предложен Н. В. Гэлвеем в «Введение в смешанное моделирование: за пределами регрессии и дисперсионного анализа» на страницах 213-214.
источник
IDconst
одинаковые для всех ваших данных, то у вас нет группировки. Вам нужен группирующий фактор, чтобы иметь хотя бы один уровень выборки, а способ настройки модели не имеет ни одного. Возможно, я мог бы поверить в обоснование использования «случайной группировки», но это совсем другая игра в мяч. Проверьте свой подход с некоторыми фиктивными данными. Я твердо верю, что с вашей предложенной настройкойlmer()
не будет работать. (Я используюlme4_0.99999911-1
)lme4_0.99999911-1
.Error in lFormula(formula = value ~ fac1 + (1 | idconst), data = dataset) : grouping factors must have at least 1 sampled level
, И, как я уже сказал, концептуально это неправильно. Дело не в том, чтобы заставить программное обеспечение выдавать какие-то цифры, это в том случае, если то, что вы говорите, является разумным. У вас нет второй смешанной модели для сравнения, если в этой модели случайный эффект по конструкции является константой. Вы могли бы также исключить это и попробовать вместо этого линейную модель.lme4
. Это может быть сделано , если вы установите опцию:control=lmerControl(check.nlev.gtr.1="ignore")
. Бен Болкер упоминает об этом здесь: github.com/lme4/lme4/issues/411 .Я хотел бы ответить на более «начальный» вопрос.
Если вы подозреваете какую-либо неоднородность в дисперсии между зависимой переменной из-за некоторых факторов, вам следует продолжить и построить график данных, используя точечные и квадратные диаграммы. Некоторые распространенные шаблоны, чтобы проверить, я разместил этот список ниже из различных источников в Интернете.
Кроме того, нанесите свою зависимую переменную по группам факторов / лечения, чтобы увидеть, есть ли постоянная дисперсия. Если нет, вы можете изучить случайные эффекты или взвешенные регрессии. Например, эта таблица ниже является примером воронкообразной дисперсии в моих группах лечения. Поэтому я выбираю случайные эффекты и проверяю эффекты на уклонах и перехватах.
Отсюда, ответы выше обслуживают ваш главный вопрос. Есть также тесты, которые проверяют гетероскедастичность, один из них здесь - https://dergipark.org.tr/download/article-file/94971 . Но я не уверен, существуют ли какие-либо тесты для обнаружения гетероскедастичности на уровне группы.
источник
ASK QUESTION
вверху и задайте его там. Поскольку вы новичок здесь, вы можете посетить наш тур , в котором есть информация для новых пользователей.