Моя статистическая программа реализует процедуры FDR Benjamini & Hochberg (1995) и Benjamini & Yekutieli (2001). Я приложил все усилия, чтобы прочитать более позднюю статью, но она достаточно математически плотная, и я не совсем уверен, что понимаю разницу между процедурами. Из базового кода в моей статистической программе я вижу, что они действительно разные и что последняя включает в себя величину q, о которой я упоминал в отношении FDR, но также не совсем понимаю.
Есть ли основания предпочесть процедуру Бенджамини и Хохберга (1995 г.), а не процедуру Бенджамини и Екутиели (2001 г.)? У них разные предположения? Каковы практические различия между этими подходами?
Benjamini Y. и Hochberg Y. (1995). Контроль уровня ложных открытий: практичный и мощный подход к многократному тестированию. Журнал Королевского статистического общества, серия B, 57, 289–300.
Benjamini, Y., и Yekutieli, D. (2001). Контроль уровня ложных обнаружений при множественном тестировании в зависимости. Летопись статистики 29, 1165–1188.
Документ 1999 года, упомянутый в комментариях ниже: Yekutieli, D. & Benjamini, Y. (1999). Частота ложных обнаружений на основе повторной выборки, управляющая несколькими процедурами испытаний для сопоставленной статистики испытаний. Журнал статистического планирования и вывода, 82 (1), 171-196.
источник
Ответы:
Бенджамини и Хохберг (1995) представили уровень ложных открытий. Benjamini и Yekutieli (2001) доказали, что оценка справедлива при некоторых формах зависимости. Зависимость может возникнуть следующим образом. Рассмотрим непрерывную переменную, используемую в t-тесте, и другую переменную, связанную с ней; например, тестирование, если ИМТ отличается в двух группах и окружность талии отличается в этих двух группах. Поскольку эти переменные коррелируют, результирующие значения р также будут коррелироваться. Yekutieli и Benjamini (1999) разработали еще одну процедуру контроля FDR, которая может использоваться при общей зависимости путем повторной выборки нулевого распределения. Поскольку сравнение относится к распределению нулевой перестановки, поскольку общее число истинных положительных значений увеличивается, метод становится более консервативным. Оказывается, что BH 1995 также консервативен, так как число истинных положительных результатов увеличивается. Чтобы улучшить это, Benjamini и Hochberg (2000) представили адаптивную процедуру FDR. Это требовало оценки параметра, нулевой пропорции, который также используется в оценке pFDR Стори. Стори дает сравнения и утверждает, что его метод является более мощным и подчеркивает консервативный характер процедуры 1995 года. Этаж также имеет результаты и моделирование в зависимости.
Все вышеперечисленные тесты действительны в условиях независимости. Вопрос в том, с каким уходом от независимости эти оценки могут быть связаны.
В настоящее время я думаю, что если вы не ожидаете слишком много истинных положительных результатов, процедура BY (1999) хороша, потому что она включает в себя особенности распределения и зависимость. Тем не менее, я не знаю о реализации. Метод Стори был рассчитан на множество истинных позитивов с некоторой зависимостью. BH 1995 предлагает альтернативу частоте ошибок по семейным обстоятельствам, и она все еще консервативна.
Бенджамини, Y и Y Хохберг. Об адаптивном контроле частоты ложных обнаружений при многократном тестировании с независимой статистикой. Журнал образовательной и поведенческой статистики, 2000.
источник
p.adjust не пропускает BY. Ссылка на теорему 1.3 (доказательство в разделе 5 на с.1182) в статье:
Benjamini, Y., и Yekutieli, D. (2001). Контроль уровня ложных обнаружений при множественном тестировании в зависимости. Летопись статистики 29, 1165–1188.
Поскольку в этой статье обсуждаются несколько различных настроек, ссылка на страницу справки (на момент написания) для p.adjust () несколько неясна. Этот метод гарантированно контролирует FDR с установленной скоростью при самой общей структуре зависимости. Информационные комментарии к слайдам Кристофера Дженовезе можно найти по адресу: www.stat.cmu.edu/~genovese/talks/hannover1-04.pdf. Обратите внимание на комментарий на слайде 37 со ссылкой на метод теоремы 1.3 в статье BY 2001 [method = «BY» с p.adjust ()], который: «К сожалению, это обычно очень консервативный, иногда даже более, чем Bonferroni».
Числовой пример:
method='BY'
противmethod='BH'
Далее сравнивается method = 'BY' с method = 'BH' с использованием функции p's p.adjust () для значений p из столбца 2 таблицы 2 в статье Бенджамини и Хохберга (2000):
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] pval 0.8563 0.6028 0.4401 0.4200 0.3864 0.3689 0.3116 0.2352 0.2096 adj='BH 0.8563 0.6211 0.4676 0.4606 0.4379 0.4325 0.3784 0.2962 0.2741 adj='BY' 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 [,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18] pval 0.1939 0.1587 0.1437 0.1003 0.0823 0.0791 0.0659 0.0580 0.0557 adj='BH 0.2637 0.2249 0.2125 0.1549 0.1332 0.1332 0.1179 0.1096 0.1096 adj='BY' 1.0000 0.9260 0.8751 0.6381 0.5485 0.5485 0.4856 0.4513 0.4513 [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27] pval 0.0549 0.0468 0.0465 0.0410 0.0204 0.0096 0.0090 0.0075 0.0040 adj='BH 0.1096 0.1060 0.1060 0.1060 0.0577 0.0298 0.0298 0.0283 0.0172 adj='BY' 0.4513 0.4367 0.4367 0.4367 0.2376 0.1227 0.1227 0.1164 0.0707 [,28] [,29] [,30] [,31] [,32] [,33] [,34] pval 0.0028 0.0020 0.0018 0e+00 0e+00 0e+00 0 adj='BH 0.0137 0.0113 0.0113 2e-04 2e-04 2e-04 0 adj='BY' 0.0564 0.0467 0.0467 7e-04 7e-04 7e-04 0
источник