Предположим, у меня есть эксперимент с двумя или более факторами. Создается общий ANOVA, а затем мы проводим два или более набора специальных тестов, скажем, многократных сравнений. Мой вопрос о том, какие большие и сколько семейств следует использовать в качестве основы для корректировки множественности этих специальных тестов.
Примером является набор данных варп-брейков из книги Тьюки об EDA. Есть два фактора: wool
(на двух уровнях) и tension
(на трех уровнях). Таблица ANOVA это:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Очевидно, что взаимодействие необходимо в модели. Поэтому мы решили провести сравнение уровней каждого фактора, удерживая другой фактор фиксированным. Результаты ниже, с некоторыми аннотациями, которые будут упомянуты позже:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Я думаю, что существуют разные практики, и мне интересно, какие из них наиболее распространены, и какие аргументы люди приводят за или против каждого подхода. При вычислении скорректированных значений , мы должны сделать корректировки множественности для ...
- каждое из пяти наименьших семейств (T | A, T | B, ..., W | H) отдельно? (Примечание: последние 3 семейства имеют только один тест, поэтому для них не будет корректировки множественности)
- каждое из больших семейств (T, с 6 тестами и W, с 3 тестами) отдельно?
- все тестов считаются одной большой семьей?
Меня интересует как то, что люди обычно делают (даже если они мало думают об этом), так и почему (если они имеют). Я мог бы упомянуть пару вещей:
- В таблице ANOVA есть 3 теста. Я не помню, чтобы кто-нибудь рассматривал поправку на множественность в тестах ANOVA. Если это так, и вы рекомендуете вариант (3), вы противоречивы?
- Если бы мы сделали несколько меньшего эксперимент , в котором все тесты являются менее мощными, возможно взаимодействие не было бы значительным, что приводит к гораздо меньшему числу постфактум сравнений только маргинальных средств. Более того, маргинальные средние могут иметь меньшие SE, чем клеточные средние в более крупном эксперименте. Если, кроме того, корректировка множественности менее консервативна, мы могли бы получить более «значимые» результаты с меньшим количеством данных, чем с большим количеством данных.
Интересно посмотреть, что люди говорят ...
источник
lsmeans
? Это было много работы для этого вопроса!