Представьте себе следующий общий дизайн:
- 100 участников случайным образом распределяются либо на лечение, либо на контрольную группу
- зависимая переменная является числовой и измеряется до и после обработки
Три очевидных варианта для анализа таких данных:
- Проверьте эффект взаимодействия группы по времени в смешанном ANOVA
- Сделайте ANCOVA с условием в качестве IV и предварительным измерением в качестве ковариации и последующим измерением в качестве DV
- Сделайте t-тест с условием, как IV и оценки перед изменением как DV
Вопрос:
- Каков наилучший способ анализа таких данных?
- Есть ли причины предпочитать один подход другому?
anova
ancova
clinical-trials
change-scores
Джером англим
источник
источник
Ответы:
По этой теме имеется огромное количество литературы (оценка изменений / прироста), и я думаю, что лучшие ссылки приходят из биомедицинской области, например
В биомедицинских исследованиях интересная работа была также проделана при изучении перекрестных исследований (особенно в отношении эффектов переноса , хотя я не знаю, насколько это применимо к вашему исследованию).
От оценки выигрыша t до ANCOVA F (и наоборот) от Knapp & Schaffer, представлен интересный обзор подхода ANCOVA против t (так называемый парадокс Лорда). Простой анализ показателей изменений не является рекомендуемым способом для предварительного / последующего проектирования, согласно Сенну в его статье « Изменение по сравнению с исходным уровнем и повторный анализ ковариации» (Stat. Med. 2006 25 (24)). Кроме того, использование модели смешанных эффектов (например, для учета корреляции между двумя временными точками) не лучше, потому что вам действительно нужно использовать «предварительное» измерение в качестве ковариации для повышения точности (посредством корректировки). Очень кратко:
Мне также нравятся мифы о десятибалльной шкале от Эдвардса, хотя основное внимание уделяется отличиям в другом контексте; но вот аннотированная библиография по анализу изменений до публикации (к сожалению, она не охватывает очень недавнюю работу). Ван Брекелен также сравнил ANOVA и ANCOVA в рандомизированных и нерандомизированных условиях, и его выводы подтверждают идею, что ANCOVA следует отдавать предпочтение, по крайней мере в рандомизированных исследованиях (которые предотвращают регрессию до среднего эффекта).
источник
Даниэль Б. Райт обсуждает это в разделе 5 своей статьи « Подружиться с вашими данными» . Он предлагает (с.130):
Он рекомендует следующие статьи для дальнейшего чтения:
источник
Наиболее распространенные стратегии:
Существует много дискуссий о толковании, предположениях и, по-видимому, парадоксальных различиях между этими двумя подходами и более сложными альтернативами (особенно, когда участники не могут быть случайно назначены для лечения), но я думаю, что они остаются довольно стандартными.
Одним из важных источников путаницы является то, что для ANOVA эффект интереса, скорее всего, является взаимодействием между временем и лечением, а не основным эффектом лечения. Кстати, F-критерий для этого термина взаимодействия даст тот же результат, что и независимый выборочный критерий Стьюдента для оценок усиления (т. Е. Оценок, полученных путем вычитания оценки перед тестом из оценки после теста для каждого участника), так что вы можете также пойти на это.
Если всего этого слишком много, у вас нет времени, чтобы выяснить это, и вы не можете получить некоторую помощь от статистика, быстрый и грязный, но ни в коем случае не совсем абсурдный подход состоял бы в простом сравнении баллов после теста с независимый выборочный t-тест, игнорирующий предварительные тестовые значения. Это имеет смысл только в том случае, если участники фактически были случайным образом распределены в группу лечения или контрольную группу .
Наконец, это само по себе не очень хорошая причина для выбора, но я подозреваю, что подход 2 выше (ANCOVA) - это то, что в настоящее время считается правильным подходом в психологии, поэтому, если вы выбираете что-то другое, вам, возможно, придется объяснить методику подробно или обосновать Себя кому-то, кто убежден, например, что «баллы за достижения, как известно, плохие».
источник
ANCOVA и повторные измерения / смешанная модель для термина взаимодействия проверяют две разные гипотезы. Ссылка на эту статью: статья 1 и эта статья: статья 2
источник
Так как у вас есть два средства (либо на конкретный предмет, либо на сумму инвентаря), нет причин рассматривать ANOVA. Парный t-тест, вероятно, уместен; это может помочь вам выбрать, какой t-тест вам нужен.
Хотите посмотреть результаты по конкретным предметам или общие оценки? Если вы хотите провести анализ предмета, это может быть полезной отправной точкой.
источник