Правильно ли я указал свою модель в lmer?

26

Я просмотрел множество справочных сайтов и все еще не понимаю, как указать более сложные вложенные термины в смешанной модели. Меня также смущает использование :и /и |при указании взаимодействий и вложений со случайными факторами, использующимися lmer()в lme4пакете в R.

Для целей этого вопроса давайте предположим, что я точно изобразил свои данные с помощью этой стандартной статистической модели: исправлено, и случайны (неявно) вложено в .

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)К
stationtowdayTowstation

Другими словами, я надеюсь, что моя модель включает в себя Station (i, fixed), Tow (j, random, неявно вложенный в Station), Day (k, random), взаимодействие между Tow и Day и взаимодействие Day. и вокзал. Я проконсультировался со статистиком, чтобы создать свою модель, и в настоящее время считаю, что она представляет мои данные, но также добавлю описание моих данных для тех, кто интересуется, внизу моего поста, чтобы не загромождать.

Пока что я смог собрать воедино следующее lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Точно ли это отражает мою статистическую модель? Любые предложения о том, как улучшить мой код, если он не читает правильно?

Я выделил конкретные термины, которые мне трудно указать в моей формуле lmer

# 1. буксировка, вложенная в пределах станции, когда буксировка является случайной, а станция фиксированной,
я в замешательстве, однако по поводу разграничения между вложенными терминами и терминами взаимодействия, которые случайным образом используют :и /. В моем примере, приведенном выше, я (1|station:tow)надеюсь, что читает буксируемый внутри станции. Я читал противоречивые комментарии на разных сайтах, должен ли я использовать :или /здесь в случайном (1|...)формате lmer.

# 2. Взаимодействие между станцией и днем, когда станция фиксирована, а день - случайный, у
меня тогда есть, (1|station:day)но в этот раз я надеюсь, что это читает взаимодействие между станцией и днем. Кажется, что я мог бы использовать станцию ​​* день, чтобы учесть индивидуальные эффекты станции и дня, а также их взаимодействие (вместо включения каждого из трех терминов в отдельности, как я делаю выше), но я не вижу, как это указать когда одно исправлено, а другое случайно. Будет ли station*(1|day)это сделать?

# 3. Взаимодействие между буксировкой и днем ​​(оба случайные), когда буксировка вложена в станцию ​​(фиксированная). Наконец, у меня есть то, (1|tow:day)что, я надеюсь, читает взаимодействие towи day, но мне интересно, нужно ли мне еще раз указать, что буксировка вложена (неявно) на станции?

Я новичок , как Rи lmerи статистического моделирования и высоко оценивают тревогу тщательных объяснений в каких - либо ответов на мои вопросы , если это возможно.

Более подробная информация о моих данных: я спрашиваю, меняются ли концентрации планктона через физический фронт в прибрежном океане. У меня есть три станции, на берегу, в пределах и за пределами этого фронта. Станция при этом исправлена. На каждой станции я беру три повторяющихся жгута планктона (из которых я сортирую, считаю и получаю концентрацию в виде количества ошибок на метр в кубе воды). Буксировка случайна: на трех буксирах я надеюсь объяснить общую изменчивость планктона на этой конкретной станции. Буксировка является неотъемлемой частью станции, так как каждая буксировка не имеет уникального идентификатора (123,123,123 - это идентификатор буксира на каждой станции). Затем я сделал это несколько независимых дней с новым фронтом, который сформировался. Я думаю, что могу думать о Дне как о блокирующем факторе? День является случайным, так как повторение этого в нескольких независимых днях переднего плана пытается фиксировать изменчивость изо дня в день и быть репрезентативным для всех дней, где этот фронт присутствует. Я хочу узнать об условиях взаимодействия, чтобы увидеть, изменяются ли буксиры изменчивости изо дня в день и всегда ли станции выдают аналогичные данные или это зависит от дня?

Еще раз спасибо за ваше время и помощь, я ценю это!

wtree
источник
Я действительно полагаю, что вам не хватает некоторых подписок (я не хотел добавлять их, если ошибался) в вашей стандартной статистической модели.
1
FWIW, для всех, кто сталкивается с этой темой и задается вопросом, является ли она тематической, учитывая ее акцент на Rсинтаксисе, IMO, она достаточно статистична (чтобы понять, как указанная модель связана с вложенностью и взаимодействиями и т. Д.), Чтобы быть в теме для резюме.
gung - Восстановить Монику
1
Это 100% по теме на мой взгляд.
2
В соответствии с вашим lmer()синтаксисом вы указали модель, в которой есть фиксированный эффект stationи четыре случайных перехвата, совместно используемые лицами с одинаковой (1) комбинацией stationи tow, (2) значением Day, (3) комбинацией stationи dayи ( 4) комбинация towи day, соответственно. Это то, что вы хотели? Я не уверен, потому что, как указывает @BabekP, то, как вы написали свою модель, неясно. Вы написали имена переменных, а не параметры. Обычно в такой модели комбинации переменных фиксируются индексами.
Макрос

Ответы:

23

Буксировка вложена в станцию, когда буксировка случайна и станция зафиксирована

station+(1|station:tow)правильно. Как сказал @John в своем ответе, (1|station/tow)расширится до (1|station)+(1|station:tow)(основной эффект станции плюс взаимодействие между буксировкой и станцией), что вам не нужно, потому что вы уже указали станцию ​​как фиксированный эффект.

Взаимодействие между станцией и днем, когда станция фиксирована и день случайный.

Взаимодействие между фиксированным и случайным эффектом всегда является случайным. Опять же, как сказал @Джон, station*dayрасширяется до того station+day+station:day, чего вы (опять же) не хотите, потому что вы уже указали dayв своей модели. Я не думаю, что есть способ сделать то, что вы хотите, и свернуть скрещенные эффекты day(случайного) и station(фиксированного), но вы можете, если хотите, написать station+(1|day/station), который, как указано в предыдущем ответе, расширится до station + (1|day) + (1|day:station).

взаимодействие между буксиром и днем, когда буксир вложен в станцию

Потому что вы не имеют уникальные значения towпеременной (то есть , потому что , как вы говорите ниже жгуты определяются как 1, 2, 3на каждой станции, вы делаете , необходимо указать вложенности, так как (1|station:tow:day). Если вы действительно были жгуты определены однозначно, вы можете использовать либо (1|tow:day)или (1|station:tow:day)(они должны дать эквивалентные ответы). Если вы не укажете в этом случае вложенность, lme4попытайтесь оценить случайный эффект, который разделяет буксир № 1 на всех станциях ...

station:tow:day××

Полезны ли вам http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification и http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed ?

Бен Болкер
источник
Большое спасибо за полезный ответ и ссылки, они очень ценятся. Меня смущает нотация (1 | a: b), которую вы описываете выше, когда кажется, что «:» может означать «вложенный в», а также взаимодействие. Как это может указать оба? Другими словами, как lmer узнает, какие отношения вы указываете? Я, должно быть, здесь упускаю что-то простое, прошу прощения.
мас.
4
В этом контексте не так уж много различий между взаимодействием и вложением. Вложен ли Bон Aили просто взаимодействует с ним, зависит от того, Aвключен ли основной эффект в модель или нет. Если основной эффект Bявляется также в модели тогда он пересек ...
Бен Bolker
Привет всем, я задал связанный вопрос здесь: stats.stackexchange.com/questions/272377/… если у кого-то (особенно @BenBolker) есть возможность посмотреть и дать ответ.
Джошуа Розенберг
11

Некоторые вещи в формуле немного сбивают с толку. Это :для взаимодействия между двумя терминами, а *для основных эффектов и взаимодействий. Это /еще один для взаимодействий, но он генерирует взаимодействие между числителем и всеми членами в знаменателе (например A/(B+C) = A:B + A:C). Это |для чего-то вроде «сгруппированы». Таким образом, 1|stationбудет перехват сгруппированы по станции и в скобках это случайно (1|station). Вот как бы вы делали вложение.

Надеюсь, это поможет. Немного странно иметь случайный эффект, вложенный в фиксированный эффект, и я не уверен, как вы это представляете. Я не могу даже представить ситуацию. Вы можете получить лучший ответ, если объясните, каковы ваши переменные и что вы хотите достичь. Много раз люди задают вопросы и неправильно используют терминологию, и с ними трудно общаться. Объясните, что представляют собой переменные и что вы хотите о них знать.

Сосредоточив внимание на вашем описании в последнем абзаце, звучит так, будто ваш буксир - это просто индикатор собранных вами проб, а не то, что вам нужно оценивать, в том смысле, что вы ожидаете, что буксир 1 будет каким-то образом последовательно отличаться от буксира 2. Буксировка просто указывает на образец. Если вы действительно не верите, что порядок буксировок имеет значение, вы даже не беспокоитесь об этой переменной. И если они имеют значение, то это фиксированный эффект (и, возможно, случайный, но не исключительно случайный эффект). Вы говорите, что хотите знать, изменяются ли буксиры изменчивостью изо дня в день. Как насчет ответа да? Дело не в реалистической вероятности того, что они не меняются изо дня в день. Это просто дисперсия ваших мер. Вы' Нельзя пытаться учесть каждую спецификацию отклонений, потому что тогда у вас не останется никаких отклонений для ошибки. У вас будет переопределенная модель. Вы бы просто сообщили о каждой мере.

Вы делаете аналогичное утверждение о том, что станция меняется в зависимости от дня; конечно так и есть. Но, может быть, вы имеете в виду конкретные дни? Были ли дни каким-то образом сгруппированы по сезону, лунному циклу и т. Д.? Если у вас нет чего-то другого, кроме этого, это день 1, это день 2 и т. Д. Как знание того, что станции меняются день ото дня, говорит вам о чем-то, кроме станций? Таким образом, ответ на этот вопрос, конечно, станции меняются день ото дня. И, конечно, буксировки меняются день ото дня и от станции к станции. В итоге вы остаетесь с простой моделью:

aov(y ~ station, data = dat)

Один фиксированный эффект, который вы имеете здесь, станция, просто отбирается за несколько сеансов и несколько дней. Я не уверен, что вам действительно нужно многоуровневое моделирование здесь вообще. Похоже, вы переоценили свою модель.

Если вам действительно нужны случайные эффекты дня и буксировки, и есть информация, которую вы здесь не указали, вы можете расширить ее до многоуровневой модели. Это было бы:

lmer(y ~ station + (two*day|station), data = dat)

Вам нужно несколько буксировок на каждой станции и в день, чтобы использовать эту модель.

Джон
источник
Я согласен со всем, что вы сказали, но я думаю, что это скорее комментарий, чем ответ.
Макрос
@ Джон, я был с тобой до тех пор, пока "так ты не вложишь". Я думаю, что я упустил фактический момент, как вы делаете вложение. Вы хотели бы объяснить более подробно? Я думаю, что я все еще смущен | и будет больше смотреть на это. Но из вашего ответа я все еще не уверен, как, например, указать, что буксировка (случайная) вложена в станцию ​​(фиксированная)?
мас. Сентября 20-13
@ Джон Ох, и станция зафиксирована как места / места интереса в океане, а буксировка случайна, потому что я беру буксирные планктоны на этих участках, которые являются случайными в том смысле, что они пытаются учесть изменчивость в планктоне на каждом участке, а затем экстраполировать представлять население планктона на станции.
мас. Сентября 20-13
1
Не каждая метка образца является случайной величиной, см. Правки.
Джон
1
Я все еще думаю, что буксир не должен быть в модели вообще, учитывая это описание. День звучит хорошо, хотя.
Джон