В настоящее время я спорю с кем-то о том, как правильно обрабатывать данные с несколькими измерениями для каждого субъекта. В этом случае данные были собраны для каждого субъекта в течение короткого времени для различных условий в каждом субъекте. Все измерения объединяют одну и ту же переменную, только несколько.
Один из вариантов теперь состоит в том, чтобы просто сгруппировать данные по условиям и не заботиться о том, чтобы несколько точек данных исходили от одного субъекта. Однако данные по каждому предмету, вероятно, не являются полностью независимыми.
Другая альтернатива состоит в том, чтобы сначала взять среднее значение всех измерений для каждого состояния от каждого субъекта, а затем сравнить средние значения. Однако это, вероятно, повлияет на значимость, поскольку в конечном счете не учитывается, что средства имеют меньшую ошибку.
Как вы можете правильно проанализировать такие данные? Об этом как-то заботятся в SPSS? В принципе, должна быть возможность рассчитать допустимую погрешность при вычислении среднего значения, а затем учитывать это в конечном счете, но я не думаю, что SPSS каким-то образом выполняет этот расчет за моей спиной.
источник
Ответы:
Было бы нарушением независимости «группировать данные по условиям и не заботиться о том, чтобы несколько точек данных исходили от одного субъекта». Так что это не пойдет. Один из подходов состоит в том, чтобы «взять среднее значение всех измерений для каждого состояния каждого субъекта и затем сравнить его». Вы можете сделать это таким образом, вы не нарушите независимость, но вы теряете некоторую информацию в агрегации на уровне предметного уровня.
На первый взгляд, это звучит как смешанный дизайн с условиями между субъектами и несколькими периодами времени, измеренными внутри объектов. Однако возникает вопрос: почему вы собирали данные в разные моменты времени? Ожидается ли, что влияние времени или прогрессия переменной во времени будет различным в зависимости от условий? Если ответ на любой из этих вопросов будет положительным, то, учитывая структуру данных, я ожидаю, что вас интересует смешанная ANOVA. Смешанный ANOVA разделит субъектную дисперсию из SSTotal «за вашей спиной» как бы. Но то, поможет ли это разделение вашей проверки условий между предметами, зависит от нескольких других факторов.
В любом случае, в SPSS / PASW 18 Анализ -> Общая линейная модель -> Повторные измерения. У вас будет одна строка для каждого предмета и один столбец для каждого момента времени, а также один в качестве идентификатора их условия. Идентификатор условия перейдет в раздел «между», и повторные измерения будут учтены при определении коэффициента повторных измерений.
источник
Повторное измерение дизайна является традиционным способом справиться с этим, как отмечает drknexus. При проведении такого рода анализа вы должны объединить один балл / условие / предмет. Чувствителен к нарушениям допущений сферичности и другим вопросам. Однако более современный метод заключается в использовании многоуровневого моделирования или линейных смешанных эффектов. Используя эту технику, вы не агрегируете данные. Есть несколько способов лечения, но я не знаю лучшего базового учебника. Baayen (2008) Глава 7 хороша. Pinheiro & Bates (2000) очень хорош, но из звуков вещей следуйте их советам во вступлении и читайте фрагменты, рекомендуемые для начинающих.
Если вы хотите просто получить результат в стиле ANOVA, предполагая, что все ваши данные представлены в длинном формате (одна строка / точка данных) и у вас есть столбцы, указывающие тему, ответ (y) и переменную условия (x), вы можете попробовать глядя на что-то подобное в R (убедитесь, что пакет lme4 установлен).
Конечно, вы можете иметь гораздо больше столбцов переменных условий, возможно, взаимодействующих. Тогда вы можете изменить команду lmer на что-то вроде ...
(Кстати, я считаю, что не агрегирование повторных мер для увеличения власти является формальной ошибкой. Кто-нибудь помнит имя?)
источник