Как выбрать между ANOVA и ANCOVA в разработанном эксперименте?

17

Я провожу эксперимент, который имеет следующее:

  • DV: потребление среза (непрерывное или может быть категоричным)

  • IV: здоровое сообщение, нездоровое сообщение, отсутствие сообщения (контроль) (3 группы, в которых люди назначаются случайным образом - категорично) Это манипулируемое сообщение о здоровье среза.

Следующие IV могут рассматриваться как отдельные переменные различия:

  • Импульсивность (это может быть категориальным, т. Е. Высоким по сравнению с низким или непрерывным и измеряется по шкале)

  • Предпочтение сладкого вкуса (это также измеряется с помощью анкеты, которая состоит из 3 вариантов для каждого вопроса)

  • ИМТ - участники будут взвешены, измерены соответственно (это также можно считать категоричным или непрерывным).

Поскольку группы будут случайным образом распределены в одну из 3 групп, я предполагаю, что я делаю какой-либо ANOVA и, возможно, буду использовать Factorial ANOVA, поскольку меня интересует, какой IV влияет больше на DV, но также и на взаимодействия между IV, как показывают исследования. что есть отношения между некоторыми комбинациями.

Но я не совсем уверен в этом из-за необходимости знать, лучше ли иметь IV все категорично, непрерывно или смешанно.

Или ANCOVA является возможностью или даже регрессом, но я не уверен в этом, учитывая, что они распределены по группам, а затем классифицированы на основе их ответов на опросы.

Я надеюсь, что это имеет смысл, и с нетерпением ожидаю услышать от кого-то о моем запросе.

Mobo
источник
Привет Мелори, это звучит как интересный эксперимент. Что касается вас IV, вы заинтересованы в том, чтобы знать, как каждый из них связан с DVнепрерывной шкалой, или вас больше интересует влияние IVгрупп, например, что люди с избыточным весом едят больше среза, чем люди с нормальным весом (по вашим BMIмеркам)?
Мишель
Привет Мишель, спасибо за ваши комментарии. Если честно, я все еще на стадии разработки и собираюсь повсюду! Но у меня есть предварительные цели, которые заключаются в следующем: Основная цель настоящего исследования состоит в том, чтобы исследовать влияние убеждений, связанных с пищевыми продуктами, в отношении здоровья продуктов на фактическое потребление пищи. Кроме того, вторичной целью является выявление степени, в которой стремление к ощущениям, предпочтение сладкого вкуса и ИМТ могут смягчить влияние убеждений, связанных с едой, на потребление пищи ».
Моб
Привет снова Мишель - просто добавляю к предыдущему комментарию. Тем не менее, сказав, что я также заинтересован во взаимодействиях между некоторыми IV, так как исследования показывают отношения, то есть люди с избыточным весом коррелируют с поиском ощущений. Помогает ли это помочь, где я нахожусь? Мне было бы интересно услышать ваши мысли. Благодарю.
Моб
Привет, Мелори, я не стал бы добавлять в BMIкачестве непрерывной меры и использовал бы категории недостаточный вес / нормальный вес / избыточный вес / ожирение, так как это твой вопрос исследования, а не то, увеличивается ли количество срезов с увеличением BMIбалла. Я бы попробовал другие IVs как непрерывные. Собираетесь ли вы публиковать, как я бы профессионально заинтересовался вашей рецензией?
Мишель
Привет Мишель, спасибо за это. Я хотел бы опубликовать. Это область интереса для вас? Итак, вы говорите, что было бы целесообразно сделать факторный ANOVA, я думаю, у меня может быть слишком много переменных, с которыми можно пытаться работать.
Моб

Ответы:

34

Как исторический факт, регрессия и ANOVA развивались раздельно и, частично благодаря традиции, до сих пор часто преподаются отдельно. Кроме того, люди часто считают ANOVA подходящей для разработанных экспериментов (т. Е. Манипуляции с переменным / случайным назначением) и регрессией в зависимости от ситуации для наблюдательных исследований (например, для загрузки данных с правительственного веб-сайта и поиска связей). Однако все это немного вводит в заблуждение. ANOVA - это регрессия, просто та, в которой все ковариаты являются категориальными. Анкова эторегрессия с качественными и непрерывными ковариатами, но без членов взаимодействия между факторами и непрерывными объясняющими переменными (т. е. так называемое «предположение о параллельных склонах»). Что касается того, является ли исследование экспериментальным или наблюдательным, это не связано с самим анализом.

Ваш эксперимент звучит хорошо. Я бы проанализировал это как регрессию (на мой взгляд, я склонен называть все регрессией). Я бы включил все ковариаты, если они вам интересны, и / или если теории, с которыми вы работаете, предполагают, что они могут быть важными. Если вы считаете, что влияние некоторых переменных может зависеть от других переменных, обязательно добавьте все необходимые термины взаимодействия. Нужно иметь в виду, что каждая объясняющая переменная (включая условия взаимодействия!) Будет потреблять определенную степень свободы, поэтому убедитесь, что размер вашей выборки адекватен. Я не стал бы дихотомизировать или иным образом категоризировать любые ваши непрерывные переменные (к сожалению, эта практика широко распространена, это действительно плохая вещь). В противном случае звучит так, будто вы уже в пути.

Обновление: Кажется, здесь есть некоторая озабоченность по поводу того, следует ли преобразовывать непрерывные переменные в переменные только с двумя (или более) категориями. Позвольте мне рассмотреть это здесь, а не в комментарии. Я бы сохранил все ваши переменные как непрерывные. Есть несколько причин, чтобы избежать категоризации непрерывных переменных:

  1. По категориям вы отбрасываете информацию - некоторые наблюдения находятся дальше от разделительной линии, а другие ближе к ней, но к ним относятся так, как если бы они были одинаковыми. В науке наша цель - собирать больше и лучше информации и лучше организовывать и интегрировать эту информацию. Выбрасывание информации просто противоположно хорошей науке, с моей точки зрения;
  2. Как указывает @Florian, вы склонны терять статистическую силу (спасибо за ссылку!);
  3. Вы теряете способность обнаруживать нелинейные отношения, как указывает @ rolando2;
  4. Что если кто-то прочитает вашу работу и задастся вопросом, что произойдет, если мы начертим линию b / t в другом месте? (Например, рассмотрите ваш пример ИМТ, что если кто-то еще через 10 лет, основываясь на том, что происходит в литературе того времени, хочет также знать о людях с недостаточным весом и о тех, кто страдает ожирением?) Они просто будут не повезло, но если вы сохраняете все в первоначальном виде, каждый читатель может оценить свою предпочтительную схему категоризации;
  5. Икс
    ИксsпLяNезнак равно0если Икс+0,7ИксsпLяNезнак равноИкс-+0,7если Икс>+0,7
    затем добавьте этот новый ИксsпLяNепеременная к вашей модели в дополнение к вашей оригинальнойИкспеременная. Выходные данные модели покажут резкий разрыв на уровне 0,7, и вы сможете оценить, улучшает ли это наше понимание данных.

1 и 5, по моему мнению, самые важные.

Gung - Восстановить Монику
источник
Привет, блин. Большое спасибо за ваши комментарии. Таким образом, вы бы использовали регрессию и не имели бы какой-либо из IV как столь категоричного тогда? Я думал, что ИМТ может быть или избыточным весом / ожирением или нормальным; вкусовые предпочтения имеют категории, а также для поиска ощущений могут быть категоричными, так как это истинные / ложные утверждения, которые затем дают оценку, которую затем можно классифицировать. Но вы видите их по-настоящему непрерывными?
Моб
Привет снова, боже, это моя предварительная цель, которая также может дать некоторую ясность: Основная цель настоящего исследования - исследовать влияние связанных с едой убеждений о полезности пищи на фактическое потребление пищи. Кроме того, вторичной целью является выявление степени, в которой стремление к ощущениям, предпочтение сладкого вкуса и ИМТ могут смягчать влияние убеждений, связанных с едой, на потребление пищи. Мне было бы интересно услышать ваши мысли.
Моб
Хороший ответ @gung. Я поддержу идею, что в идеале вы должны поддерживать свои непрерывные переменные такими, какие они есть, поскольку это даст вам больше информации. Многим людям сложно научиться включать в себя как непрерывные, так и категориальные предикторы, но это может оказаться полезным как для данного исследования, так и для будущего. И независимо от того, классифицируете ли вы их по категориям, попробуйте найти способы раскрытия любых нелинейных отношений, которые могут существовать - возможно, U-образной, или перевернутой-U-образной, или J-, или обратной-J. Это может существенно обогатить ваше исследование.
rolando2
Да +1 за ответ банды! Дихотомизация непрерывных переменных никогда не бывает хорошей идеей, например, из-за потери мощности (например, в статье известного Джейкоба Коэна unc.edu/~rcm/psy282/cohen.1983.pdf ). Чтобы обработать ваше «сообщение» IV в регрессионном анализе, я рекомендую использовать контрастные коды для проверки его эффекта (и взаимодействия, включающие этот IV), см., Например, Judd, CM, & McClelland, GH, Ryan, C. (2008 ). Анализ данных: подход сравнения моделей (2-е изд.). Нью-Йорк: Рутледж Пресс.
Florian
Привет rolando2, большое спасибо за ваш отзыв. Вы правы в том, что мне трудно комбинировать как категориальные, так и непрерывные переменные, что затрудняет мне определение того, какой анализ использовать. Моя предварительная цель заключается в следующем: Основная цель настоящего исследования состоит в том, чтобы исследовать влияние убеждений, связанных с пищевыми продуктами, на здоровую пищу на фактическое потребление пищи. Кроме того, вторичной целью является выявление степени, в которой стремление к ощущениям, предпочтение сладкого вкуса и ИМТ могут смягчить влияние убеждений, связанных с едой, на потребление пищи ». Мысли об этом?
Моб