Могу ли я получить помощь в завершении этой пробной (находящейся в процессе) попытки получить ориентиры по эквивалентам ANOVA и REGRESSION? Я пытался согласовать понятия, номенклатуру и синтаксис этих двух методологий. На этом сайте есть много сообщений об их общности, например, об этом или об этом , но все же хорошо иметь быструю карту «вы здесь», когда начинаете.
Я планирую обновить этот пост и надеюсь получить помощь в исправлении ошибок.
Односторонний ANOVA:
Structure: DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario: miles-per-gal. vs cylinders
Note that Income vs Gender (M, F) is a t-test.
Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
Двухсторонний ANOVA:
Structure: DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario: mpg ~ cylinders & carburators
Syntax: fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
Двухсторонний факториал ANOVA:
Structure: All possible COMBINATIONS of LEVELS are considered.
Scenario: mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax: fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANCOVA:
Structure: DV continuous ~ Factor and continuous COVARIATE.
Scenario: mpg ~ cylinders + weight
Syntax: fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars)
# with F dummy coded;
summary(fit); anova(fit)
MANOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario: mpg and wt ~ cylinders
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression: N/A
MANCOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario: mpg and wt ~ cyl + displacement (cubic inches)
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression: N/A
ВНУТРИ ФАКТОРА (или ПРЕДМЕТА) ANOVA: ( код здесь )
Structure: DV continuous ~ FACTOR with each level * with subject (repeated observations).
Extension paired t-test. Each subject measured at each level multiple times.
Scenario: Memory rate ~ Emotional value of words for Subjects @ Times
Syntax: fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data);
summary(fit); print(model.tables(fit, "means"), digits=3);
boxplot(Recall_Rate ~ Emtl_Value, data=data)
with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
summary(fit); anova(fit); coefficients(fit); confint(fit)
SPLIT-PLOT: ( код здесь )
Structure: DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario: Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer
& RANDOM EFFECTS (Blocks and plots of land):
Syntax: fit <- aov(yield ~ irrigation * density * fertilizer +
Error(block/irrigation/density), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest);
fit <- lmer(yield ~ irrigation * fertilizer +
(1|block/irrigation/density), data = splityield);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
library(nlme)
fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
summary(fit); anova(fit)
ВСТРОЕННЫЙ ДИЗАЙН: ( код здесь )
Structure: DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario: [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect:
Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide).
Syntax: fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
summary(fit); anova(fit); VarCorr(fit)
ПОЛЕЗНЫЕ САЙТЫ:
regression
anova
mixed-model
Antoni Parellada
источник
источник
cyl + hp
. Horespower непрерывна, поэтому здесь не работает.carb
Количество карбюраторов будет лучшим выбором.Ответы:
Хороший список, Антони. Вот несколько небольших предложений:
Односторонний ANOVA: IV - ФАКТОР с 3 или более уровнями. Вы также можете добавить Пример данных: mtcars к этой записи. (Аналогично, вы можете добавить операторы * Example Data "ко всем вашим записям, чтобы было понятнее, какие наборы данных вы используете.)
Двухсторонняя анова: почему бы не использовать IV1 и IV2 и указать, что две независимые переменные должны быть факторами, по крайней мере, с двумя уровнями каждый? То, как вы это заявили в настоящее время, предполагает, что двусторонняя анова может включать более 2 независимых переменных (или факторов), что не имеет смысла.
Для двухсторонней ановы я бы различал эти два под-случая: 1. Двусторонняя анова с основными эффектами для IV1 и IV2 и 2. Двусторонняя анова с взаимодействием между IV1 и IV2. Этот второй пункт - это то, что вы называете двумя как факторная двусторонняя анова.) Лучшим способом описания этих двух под-случаев будет: 1. Эффект IV1 на DV не зависит от эффекта IV2 и 2. Эффект IV1 от DV зависит от IV2. Можно также прояснить, что это независимые переменные IV1 и IV2, которые фиктивно кодируются в настройке регрессии.
Что касается ANCOVA, вы можете уточнить, что вы рассматриваете только одностороннюю ANCOVA в своем текущем примере. Для полноты можно добавить двусторонний пример ANCOVA без взаимодействия между IV1 и IV2 и один с взаимодействием между этими двумя переменными.
Для всего вышеперечисленного можно также добавить элемент под названием « Цель» , который описывает, когда эти анализы полезны. Например:
Цель (односторонней ановы): исследовать, отличаются ли средние значения DV на уровнях IV.
Что касается MANOVA, можете ли вы уточнить, что для этого потребуется (а) два или более DV и (2) один или несколько IV, которые являются факторами? Я думаю, вы можете различить одностороннюю MANOVA (с 1 фактором) и двустороннюю MANOVA? То же самое для MANCOVA.
ANOVA WITHIN-FACTOR также известна как ANOVA REPEATED MEASURES, поэтому, возможно, вы сможете добавить эту терминологию в свой список для тех, кто с ней знаком. Также было бы полезно уточнить, что моделирование смешанных эффектов обеспечивает альтернативный способ моделирования данных повторных измерений. В противном случае читатели могут не оценить разницу между двумя подходами.
источник