Шпаргалка ANOVA Алфавитный суп и регрессивные эквиваленты

18

Могу ли я получить помощь в завершении этой пробной (находящейся в процессе) попытки получить ориентиры по эквивалентам ANOVA и REGRESSION? Я пытался согласовать понятия, номенклатуру и синтаксис этих двух методологий. На этом сайте есть много сообщений об их общности, например, об этом или об этом , но все же хорошо иметь быструю карту «вы здесь», когда начинаете.

Я планирую обновить этот пост и надеюсь получить помощь в исправлении ошибок.

Односторонний ANOVA:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

Двухсторонний ANOVA:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

Двухсторонний факториал ANOVA:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

ВНУТРИ ФАКТОРА (или ПРЕДМЕТА) ANOVA: ( код здесь )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( код здесь )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

ВСТРОЕННЫЙ ДИЗАЙН: ( код здесь )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

ПОЛЕЗНЫЕ САЙТЫ:

  1. RExRepos
  2. Индивидуальный проект
  3. Quick-R
  4. R-Блоггеры
  5. Вложенный анализ и сплит-график М. Кроули
  6. Модели с несколькими случайными эффектами
  7. Сплит Модели
  8. Книга Р. М. Кроули
  9. Внутри групп и повторных измерений
  10. Повторите меры в R
  11. GLMM FAQ
Antoni Parellada
источник
Одно замечание: для ваших двухсторонних примеров ANOVA (прямой и факторный) ваш сценарий / синтаксис таков cyl + hp. Horespower непрерывна, поэтому здесь не работает. carbКоличество карбюраторов будет лучшим выбором.
Грегор
Спасибо! Неосторожная ошибка. Благодаря вашей заметке я также обнаружил, что цил обрабатывается как непрерывный, поэтому я изменил его на as.factor. И я включил TukeyHSD.
Антони Пареллада
1
Я думаю, что вы должны исключить «Survival» из названия, поскольку это очень специфическая область статистики, совершенно не связанная с тем, что вы (очень хорошо) суммируете.
Брайан Хэнсон
Хорошее резюме Антони! Возможно, вы могли бы также добавить glmmFAQ от Бена Болкера и, возможно, несколько простых биномиальных и пуассоновских примеров (GLM и GLMM). Но я понимаю, что это может слишком усложнить ситуацию и убрать из этого красивого и краткого резюме. В качестве альтернативы вы можете сослаться на примеры на этом сайте. Для полного простого примера Пуассона / отрицательного бинома это может работать: stats.stackexchange.com/questions/325334/…
Stefan

Ответы:

2

Хороший список, Антони. Вот несколько небольших предложений:

Односторонний ANOVA: IV - ФАКТОР с 3 или более уровнями. Вы также можете добавить Пример данных: mtcars к этой записи. (Аналогично, вы можете добавить операторы * Example Data "ко всем вашим записям, чтобы было понятнее, какие наборы данных вы используете.)

Двухсторонняя анова: почему бы не использовать IV1 и IV2 и указать, что две независимые переменные должны быть факторами, по крайней мере, с двумя уровнями каждый? То, как вы это заявили в настоящее время, предполагает, что двусторонняя анова может включать более 2 независимых переменных (или факторов), что не имеет смысла.

Для двухсторонней ановы я бы различал эти два под-случая: 1. Двусторонняя анова с основными эффектами для IV1 и IV2 и 2. Двусторонняя анова с взаимодействием между IV1 и IV2. Этот второй пункт - это то, что вы называете двумя как факторная двусторонняя анова.) Лучшим способом описания этих двух под-случаев будет: 1. Эффект IV1 на DV не зависит от эффекта IV2 и 2. Эффект IV1 от DV зависит от IV2. Можно также прояснить, что это независимые переменные IV1 и IV2, которые фиктивно кодируются в настройке регрессии.

Что касается ANCOVA, вы можете уточнить, что вы рассматриваете только одностороннюю ANCOVA в своем текущем примере. Для полноты можно добавить двусторонний пример ANCOVA без взаимодействия между IV1 и IV2 и один с взаимодействием между этими двумя переменными.

Для всего вышеперечисленного можно также добавить элемент под названием « Цель» , который описывает, когда эти анализы полезны. Например:

Цель (односторонней ановы): исследовать, отличаются ли средние значения DV на уровнях IV.

Что касается MANOVA, можете ли вы уточнить, что для этого потребуется (а) два или более DV и (2) один или несколько IV, которые являются факторами? Я думаю, вы можете различить одностороннюю MANOVA (с 1 фактором) и двустороннюю MANOVA? То же самое для MANCOVA.

ANOVA WITHIN-FACTOR также известна как ANOVA REPEATED MEASURES, поэтому, возможно, вы сможете добавить эту терминологию в свой список для тех, кто с ней знаком. Также было бы полезно уточнить, что моделирование смешанных эффектов обеспечивает альтернативный способ моделирования данных повторных измерений. В противном случае читатели могут не оценить разницу между двумя подходами.

оборота Изабелла Гемент
источник
Мне легче давать предложения, а не вносить изменения ».
Изабелла Гемент,