У меня есть следующий вывод:
Generalized linear mixed model fit by the Laplace approximation
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape)
AIC BIC logLik deviance
4062 4093 -2022 4044
Random effects:
Groups Name Variance Std.Dev.
landscape (Intercept) 0.82453 0.90804
Number of obs: 239, groups: landscape, 45
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.65120 0.14051 18.868 <2e-16
sMFS2 0.26922 0.17594 1.530 0.1260
sAG2 0.09268 0.14529 0.638 0.5235
sSHDI2 0.28345 0.17177 1.650 0.0989
sbare 0.41388 0.02976 13.907 <2e-16
seasonlate -0.50165 0.02729 -18.384 <2e-16
cropforage 0.79000 0.06724 11.748 <2e-16
cropsoy 0.76507 0.04920 15.551 <2e-16
Correlation of Fixed Effects:
(Intr) sMFS2 sAG2 sSHDI2 sbare sesnlt crpfrg
sMFS2 -0.016
sAG2 0.006 -0.342
sSHDI2 -0.025 0.588 -0.169
sbare -0.113 -0.002 0.010 0.004
seasonlate -0.034 0.005 -0.004 0.001 -0.283
cropforage -0.161 -0.005 0.012 -0.004 0.791 -0.231
cropsoy -0.175 -0.022 0.013 0.013 0.404 -0.164 0.557
Все мои непрерывные переменные (обозначенные маленьким s
перед именем переменной) стандартизированы (z-показатели). season
является категориальной переменной с 2 уровнями (ранний и поздний) и crop
является категориальной переменной с 3 уровнями (кукуруза, корм и соя).
Эта корреляция матрицы фиксированных эффектов действительно смущает меня, потому что все корреляции имеют противоположный знак, который они имеют, когда я смотрю на простые регрессии пар переменных. то есть корреляция матрицы фиксированных эффектов предполагает сильную положительную корреляцию между cropforage
и sbare
, когда на самом деле существует очень сильная ОТРИЦАТЕЛЬНАЯ корреляция между этими переменными - кормовые культуры, как правило, имеют гораздо меньше голого грунта по сравнению с зерновыми и соевыми культурами. Пары непрерывных переменных имеют одну и ту же проблему, корреляция матрицы фиксированных эффектов говорит о том, что все противоположно тому, что должно быть ... Может ли это быть просто из-за сложности модели (а не простой регрессии)? Может ли это быть связано с тем, что переменные стандартизированы?
Спасибо.
Если ваши отрицательные и положительные корреляции имеют одинаковое значение и различаются только их знаки, вы ошибочно вводите переменную. Но я не думаю, что это так, потому что вы уже достаточно продвинуты в статистике.
Несоответствие, которое вы испытываете, может быть и, вероятно, вызвано мультиколлинеарностью. Это означает, что когда некоторые независимые переменные имеют некоторые перекрывающиеся эффекты или, другими словами, коррелируют сами. например, моделирование переменных «скорость роста» и «размер опухоли» может вызывать мультиколлинеарность, так как возможно и вероятно, что большие опухоли имеют более высокие скорости роста (до того, как они обнаружены) сами по себе. Это может запутать модель. И если в вашей модели мало независимых переменных, которые связаны друг с другом, интерпретация результатов иногда может оказаться довольно сложной. Иногда это приводит к совершенно странным коэффициентам, даже к таким степеням, что знак некоторых корреляций меняется на противоположный.
Сначала вы должны обнаружить источники мультиколлинеарности и разобраться с ними, а затем повторно запустить анализ.
источник
Может быть полезно показать, что эти корреляции между фиксированными эффектами получены путем преобразования vcov модели в матрицу корреляции. Если
fit
вам подходит модель lme4, тои корреляции между фиксированными эффектами являются недиагональными элементами.
источник