Следует ли смоделировать разницу между контролем и лечением явно или неявно?

9

Учитывая следующую экспериментальную установку:

Многократные образцы взяты от предмета, и каждый образец обработан многократными способами (включая контрольную обработку). Что в основном интересно, так это разница между контролем и каждым лечением.

Я могу думать о двух простых моделях для этих данных. Для образца , обработка j , обработка 0 - контроль, пусть Y i j - данные, γ i - базовая линия для образца i , δ j - разница для обработки j . Первая модель смотрит как на контроль, так и на разницу:яJYяJγяяδJJ

δ 0 = 0

YяJзнак равноγя+δJ+εяJ
δ0знак равно0

Пока вторая модель смотрит только на разницу. Если мы предвычислять заранее д я J = Y я J - Да я 0 , то д я J = δ J + ε я JdяJ

dяJзнак равноYяJ-Yя0
dяJзнак равноδJ+εяJ

Мой вопрос: в чем принципиальные различия между этими двумя настройками? В частности, если уровни сами по себе бессмысленны и имеет значение только различие, делает ли первая модель слишком много и, возможно, недостаточно сильна?

Ронан Дейли
источник
2
Я могу дать более подробный ответ позже, но я бы предложил, чтобы эта статья Пола Эллисона была бы интересна ( Allison, 1990 ).
Энди W
1
Отредактировано, чтобы отразить тот факт, что ошибки в разных моделях на самом деле не одинаковы, и, следовательно, не должны использовать одни и те же символы.
Ронан Дейли

Ответы:

6

εяJ

Во-первых, эти термины представляют ошибку измерения и отклонения от аддитивной модели. С разумной осторожностью - например, путем рандомизации последовательности измерений - эти ошибки можно сделать независимыми, когда модель точна. Откуда

dяJзнак равноYяJ-Yя0знак равноγя+δJ+εяJ-(γя+δ0+εя0)знак равноδJ+(εяJ-εя0),

εя0знак равно0γя

J,К0JК

Соv(dяJ,dяК)знак равноСоv(εяJ-εя0,εяК-εя0)знак равноВaр(εя0)0.

Корреляция может быть существенной. Для ошибок iid аналогичный расчет показывает, что он равен 0.5. Если вы не используете процедуры, которые явно и правильно обрабатывают эту корреляцию, предпочтите первую модель второй.

Whuber
источник
Итак, вы предположили, что первая модель является истинной моделью, и получили нежелательное свойство второй модели. Мы знаем, что все модели ошибочны, так значит ли этот результат действительно значимым?
Макро
1
@Macro Пожалуйста, прочитайте мой ответ более внимательно: он составлен таким образом, чтобы показать, какие предположения необходимы для обоснования первой модели и отличить ее от второй, но не содержит предположений о том, что любая модель является «верной». Например, обратите внимание на предостережение «когда модель точна». Даже слово «точный» было выбрано с некоторой мыслью, чтобы избежать ошибочного представления о том, что существует «истинная» или «правильная» модель.
whuber
1
dяК
1
JКJ,К0
@whuber Существуют ли ссылки, подтверждающие ваше утверждение, например, чтобы убедить рецензентов?
Даниэль