Я просмотрел множество справочных сайтов и все еще не понимаю, как указать более сложные вложенные термины в смешанной модели. Меня также смущает использование :
и /
и |
при указании взаимодействий и вложений со случайными факторами, использующимися lmer()
в lme4
пакете в R
.
Для целей этого вопроса давайте предположим, что я точно изобразил свои данные с помощью этой стандартной статистической модели: исправлено, и случайны (неявно) вложено в .
station
tow
day
Tow
station
Другими словами, я надеюсь, что моя модель включает в себя Station (i, fixed), Tow (j, random, неявно вложенный в Station), Day (k, random), взаимодействие между Tow и Day и взаимодействие Day. и вокзал. Я проконсультировался со статистиком, чтобы создать свою модель, и в настоящее время считаю, что она представляет мои данные, но также добавлю описание моих данных для тех, кто интересуется, внизу моего поста, чтобы не загромождать.
Пока что я смог собрать воедино следующее lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Точно ли это отражает мою статистическую модель? Любые предложения о том, как улучшить мой код, если он не читает правильно?
Я выделил конкретные термины, которые мне трудно указать в моей формуле lmer
# 1. буксировка, вложенная в пределах станции, когда буксировка является случайной, а станция фиксированной,
я в замешательстве, однако по поводу разграничения между вложенными терминами и терминами взаимодействия, которые случайным образом используют :
и /
. В моем примере, приведенном выше, я (1|station:tow)
надеюсь, что читает буксируемый внутри станции. Я читал противоречивые комментарии на разных сайтах, должен ли я использовать :
или /
здесь в случайном (1|...)
формате lmer
.
# 2. Взаимодействие между станцией и днем, когда станция фиксирована, а день - случайный, у
меня тогда есть, (1|station:day)
но в этот раз я надеюсь, что это читает взаимодействие между станцией и днем. Кажется, что я мог бы использовать станцию * день, чтобы учесть индивидуальные эффекты станции и дня, а также их взаимодействие (вместо включения каждого из трех терминов в отдельности, как я делаю выше), но я не вижу, как это указать когда одно исправлено, а другое случайно. Будет ли station*(1|day)
это сделать?
# 3. Взаимодействие между буксировкой и днем (оба случайные), когда буксировка вложена в станцию (фиксированная).
Наконец, у меня есть то, (1|tow:day)
что, я надеюсь, читает взаимодействие tow
и day
, но мне интересно, нужно ли мне еще раз указать, что буксировка вложена (неявно) на станции?
Я новичок , как R
и lmer
и статистического моделирования и высоко оценивают тревогу тщательных объяснений в каких - либо ответов на мои вопросы , если это возможно.
Более подробная информация о моих данных: я спрашиваю, меняются ли концентрации планктона через физический фронт в прибрежном океане. У меня есть три станции, на берегу, в пределах и за пределами этого фронта. Станция при этом исправлена. На каждой станции я беру три повторяющихся жгута планктона (из которых я сортирую, считаю и получаю концентрацию в виде количества ошибок на метр в кубе воды). Буксировка случайна: на трех буксирах я надеюсь объяснить общую изменчивость планктона на этой конкретной станции. Буксировка является неотъемлемой частью станции, так как каждая буксировка не имеет уникального идентификатора (123,123,123 - это идентификатор буксира на каждой станции). Затем я сделал это несколько независимых дней с новым фронтом, который сформировался. Я думаю, что могу думать о Дне как о блокирующем факторе? День является случайным, так как повторение этого в нескольких независимых днях переднего плана пытается фиксировать изменчивость изо дня в день и быть репрезентативным для всех дней, где этот фронт присутствует. Я хочу узнать об условиях взаимодействия, чтобы увидеть, изменяются ли буксиры изменчивости изо дня в день и всегда ли станции выдают аналогичные данные или это зависит от дня?
Еще раз спасибо за ваше время и помощь, я ценю это!
источник
R
синтаксисе, IMO, она достаточно статистична (чтобы понять, как указанная модель связана с вложенностью и взаимодействиями и т. Д.), Чтобы быть в теме для резюме.lmer()
синтаксисом вы указали модель, в которой есть фиксированный эффектstation
и четыре случайных перехвата, совместно используемые лицами с одинаковой (1) комбинациейstation
иtow
, (2) значениемDay
, (3) комбинациейstation
иday
и ( 4) комбинацияtow
иday
, соответственно. Это то, что вы хотели? Я не уверен, потому что, как указывает @BabekP, то, как вы написали свою модель, неясно. Вы написали имена переменных, а не параметры. Обычно в такой модели комбинации переменных фиксируются индексами.Ответы:
Буксировка вложена в станцию, когда буксировка случайна и станция зафиксирована
station+(1|station:tow)
правильно. Как сказал @John в своем ответе,(1|station/tow)
расширится до(1|station)+(1|station:tow)
(основной эффект станции плюс взаимодействие между буксировкой и станцией), что вам не нужно, потому что вы уже указали станцию как фиксированный эффект.Взаимодействие между станцией и днем, когда станция фиксирована и день случайный.
Взаимодействие между фиксированным и случайным эффектом всегда является случайным. Опять же, как сказал @Джон,
station*day
расширяется до тогоstation+day+station:day
, чего вы (опять же) не хотите, потому что вы уже указалиday
в своей модели. Я не думаю, что есть способ сделать то, что вы хотите, и свернуть скрещенные эффектыday
(случайного) иstation
(фиксированного), но вы можете, если хотите, написатьstation+(1|day/station)
, который, как указано в предыдущем ответе, расширится доstation + (1|day) + (1|day:station)
.взаимодействие между буксиром и днем, когда буксир вложен в станцию
Потому что вы не имеют уникальные значения
tow
переменной (то есть , потому что , как вы говорите ниже жгуты определяются как1
,2
,3
на каждой станции, вы делаете , необходимо указать вложенности, так как(1|station:tow:day)
. Если вы действительно были жгуты определены однозначно, вы можете использовать либо(1|tow:day)
или(1|station:tow:day)
(они должны дать эквивалентные ответы). Если вы не укажете в этом случае вложенность,lme4
попытайтесь оценить случайный эффект, который разделяет буксир № 1 на всех станциях ...station:tow:day
Полезны ли вам http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification и http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed ?
источник
B
онA
или просто взаимодействует с ним, зависит от того,A
включен ли основной эффект в модель или нет. Если основной эффектB
является также в модели тогда он пересек ...Некоторые вещи в формуле немного сбивают с толку. Это
:
для взаимодействия между двумя терминами, а*
для основных эффектов и взаимодействий. Это/
еще один для взаимодействий, но он генерирует взаимодействие между числителем и всеми членами в знаменателе (напримерA/(B+C) = A:B + A:C
). Это|
для чего-то вроде «сгруппированы». Таким образом,1|station
будет перехват сгруппированы по станции и в скобках это случайно(1|station)
. Вот как бы вы делали вложение.Надеюсь, это поможет. Немного странно иметь случайный эффект, вложенный в фиксированный эффект, и я не уверен, как вы это представляете. Я не могу даже представить ситуацию. Вы можете получить лучший ответ, если объясните, каковы ваши переменные и что вы хотите достичь. Много раз люди задают вопросы и неправильно используют терминологию, и с ними трудно общаться. Объясните, что представляют собой переменные и что вы хотите о них знать.
Сосредоточив внимание на вашем описании в последнем абзаце, звучит так, будто ваш буксир - это просто индикатор собранных вами проб, а не то, что вам нужно оценивать, в том смысле, что вы ожидаете, что буксир 1 будет каким-то образом последовательно отличаться от буксира 2. Буксировка просто указывает на образец. Если вы действительно не верите, что порядок буксировок имеет значение, вы даже не беспокоитесь об этой переменной. И если они имеют значение, то это фиксированный эффект (и, возможно, случайный, но не исключительно случайный эффект). Вы говорите, что хотите знать, изменяются ли буксиры изменчивостью изо дня в день. Как насчет ответа да? Дело не в реалистической вероятности того, что они не меняются изо дня в день. Это просто дисперсия ваших мер. Вы' Нельзя пытаться учесть каждую спецификацию отклонений, потому что тогда у вас не останется никаких отклонений для ошибки. У вас будет переопределенная модель. Вы бы просто сообщили о каждой мере.
Вы делаете аналогичное утверждение о том, что станция меняется в зависимости от дня; конечно так и есть. Но, может быть, вы имеете в виду конкретные дни? Были ли дни каким-то образом сгруппированы по сезону, лунному циклу и т. Д.? Если у вас нет чего-то другого, кроме этого, это день 1, это день 2 и т. Д. Как знание того, что станции меняются день ото дня, говорит вам о чем-то, кроме станций? Таким образом, ответ на этот вопрос, конечно, станции меняются день ото дня. И, конечно, буксировки меняются день ото дня и от станции к станции. В итоге вы остаетесь с простой моделью:
Один фиксированный эффект, который вы имеете здесь, станция, просто отбирается за несколько сеансов и несколько дней. Я не уверен, что вам действительно нужно многоуровневое моделирование здесь вообще. Похоже, вы переоценили свою модель.
Если вам действительно нужны случайные эффекты дня и буксировки, и есть информация, которую вы здесь не указали, вы можете расширить ее до многоуровневой модели. Это было бы:
Вам нужно несколько буксировок на каждой станции и в день, чтобы использовать эту модель.
источник