В литературе как по частоте появления ошибок (FWER), так и по частоте ложных обнаружений (FDR) конкретные методы контроля FWER или FDR считаются подходящими для зависимых или независимых тестов. Например, в статье 1979 года «Простая последовательная объективная процедура множественных испытаний» Холм писал, чтобы противопоставить свой метод повышения Шидака и метод контроля Бонферрони:
Та же самая вычислительная простота получается, когда статистика теста независима .
В «Контроле уровня ложных открытий» Бенджамини и Хохберга (1995) авторы пишут:
Теорема 1. Для независимой статистики теста и для любой конфигурации ложных нулевых гипотез вышеупомянутая процедура управляет FDR при .
Позже, в 2001 году, Бенджамини и Екутиели пишут:
1.3. Проблема . При попытке использовать подход FDR на практике статистические данные о зависимых тестах встречаются чаще, чем независимые , примером чего является приведенный выше пример с несколькими конечными точками.
Какие конкретные значения зависимого и независимого используют эти авторы? Я был бы рад получить формальные определения того, что делает тесты зависимыми или независимыми друг от друга, если они сопровождают объяснение простым языком.
Я могу придумать несколько разных возможных значений, но я не совсем понимаю, какими они могут быть:
«Зависимый» означает многовариантные тесты (т. Е. Множество зависимых переменных с одинаковыми или похожими предикторами); независимый означает одномерные тесты (т.е. много независимых переменных, одна зависимая переменная).
«Зависимый» означает тесты, основанные на парных / совпавших предметах (например, парный t- тест, повторные измерения ANOVA и т. Д.); «Независимый» означает непарные / независимые образцы исследования образцов.
«Зависимый» означает, что вероятность отклонения теста коррелирует с вероятностью отклонения другого теста, а «положительная зависимость» означает, что эта корреляция является положительной; «независимый» означает, что вероятности отклонения не связаны.
Ссылки
Benjamini, Y. и Hochberg, Y. (1995). Контроль частоты ложных открытий: практичный и эффективный подход к многократному тестированию . Журнал Королевского статистического общества. Серия B (Методологическая) , 57 (1): 289–300.
Benjamini, Y. и Yekutieli, D. (2001). Контроль уровня ложных обнаружений при множественном тестировании в зависимости . Летопись статистики , 29 (4): 1165–1188.
Holm S. (1979). Простая последовательно объективная процедура множественных испытаний . Скандинавский журнал статистики , 6 (65-70): 1979.
Ответы:
(ANOVA решает эту проблему посредством своего общего F-теста. Это своего рода сравнение, «чтобы управлять ими всеми»: мы не будем доверять групповому сравнению, если сначала этот F-тест не будет значительным.)
Совместные распределения независимых случайных величин легко вычислить. Поэтому в литературе проводится различие между этой ситуацией и случаем отсутствия независимости.
Соответственно, правильное значение слова «независимый» в цитатах в обычном статистическом смысле независимых случайных величин.
источник