У меня есть данные, собранные из эксперимента, организованного следующим образом:
Два участка, каждый с 30 деревьями. 15 лечат, 15 контролируют на каждом участке. Из каждого дерева мы отбираем три куска ствола и три куска корней, так что по 6 образцов первого уровня на дерево, которое представлено одним из двух уровней фактора (корень, стебель). Затем из этих образцов ствола / корня мы отбираем две пробы, рассекая разные ткани внутри пробы, что представлено одним из двух уровней факторов для типа ткани (тип ткани A, тип ткани B). Эти образцы измеряются как непрерывная переменная. Общее количество наблюдений составляет 720; 2 участка * 30 деревьев * (три образца ствола + три образца корня) * (один образец ткани A + один образец ткани B). Данные выглядят так ...
ï..Site Tree Treatment Organ Sample Tissue Total_Length
1 L LT1 T R 1 Phloem 30
2 L LT1 T R 1 Xylem 28
3 L LT1 T R 2 Phloem 46
4 L LT1 T R 2 Xylem 38
5 L LT1 T R 3 Phloem 103
6 L LT1 T R 3 Xylem 53
7 L LT1 T S 1 Phloem 29
8 L LT1 T S 1 Xylem 21
9 L LT1 T S 2 Phloem 56
10 L LT1 T S 2 Xylem 49
11 L LT1 T S 3 Phloem 41
12 L LT1 T S 3 Xylem 30
Я пытаюсь соответствовать модели смешанных эффектов, используя R и lme4, но я новичок в смешанных моделях. Я хотел бы смоделировать ответ как Обработка + Фактор уровня 1 (ствол, корень) + Фактор уровня 2 (ткань А, ткань В), со случайными эффектами для конкретных образцов, вложенных в эти два уровня.
В R я делаю это, используя lmer, следующим образом
fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample))
Из моего понимания (... который не уверен, и почему я публикую!) Термин:
(1|Tree/Organ/Sample)
Указывает, что «Образец» вложен в образцы органов, которые вложены в дерево. Является ли этот вид вложений актуальным / действительным? Извините, если этот вопрос не ясен, если да, пожалуйста, укажите, где я могу уточнить.
Я прочитал этот вопрос и ответ д-ра Болкера и попытался воспроизвести данные (честно говоря, меня мало заботит вопрос о том, что представляет собой «длина» в биологических терминах или единицах, а затем подгоняю модель, как указано выше. Я публикую результаты здесь делиться и искать обратную связь относительно вероятного наличия недоразумений.
Код, который я использовал для генерации этих вымышленных данных, можно найти здесь , а набор данных имеет внутреннюю структуру OP:
Структура выглядит следующим образом:
Набор данных был «сфальсифицирован» (обратная связь приветствуется) следующим образом:
treatment
существует фиксированный эффект с двумя различными перехватами для лечения и контроля (100
против70
), и нет случайных эффектов.tissue
видных фиксированных эффектов с очень разными перехватами для «phloem
против»xylem
(«3
против»6
) и для случайных эффектов с «а»sd = 3
.organ
sd = 3
6
root
stem
tree
у нас просто есть случайные эффекты сsd = 7
.sample
Я пытался настроить только случайные эффектыsd = 5
.site
также просто случайные эфф сsd = 3
.Из-за категорического характера переменных не было настроено никаких склонов.
Результаты модели смешанных эффектов:
мы:
Как это получилось:
treatment
перехвата без лечения было79.8623
(я установил среднее значение70
), а для лечения это было79.8623 + 21.4368 = 101.2991
(мы установили среднее значение)100
.tissue
был3.1820
вкладxylem
, и я установил разницу междуphloem
иxylem
из3
. Случайные эффекты не были частью модели.organ
образцов изstem
увеличенного перехвата0.1856
- я не установил разницы в фиксированных эффектах междуstem
иroot
. Стандартное отклонение того, что я хотел действовать как случайный эффект, не было отражено.tree
случайные эффекты с сд от7
всплыли красиво , как7.027
.sample
, начальнаяsd
часть5
была недооценена как3.088
.site
не был частью модели.Таким образом, в целом кажется, что модель соответствует структуре данных.
источник