В известной оригинальной статье Benjamini & Hochberg (1995) описана процедура принятия / отклонения гипотез, основанная на корректировке уровней альфа. Эта процедура имеет простую эквивалентную переформулировку в терминах скорректированных p значений, но она не обсуждалась в оригинальной статье. По словам Гордона Смита , он ввел скорректированные p в 2002 году при реализации p.adjust
в R. К сожалению, нет соответствующей цитаты, поэтому мне всегда было неясно, на что следует ссылаться, если использовать p -значения, скорректированные с помощью BH .
Оказывается, процедура описана в Benjamini, Heller, Yekutieli (2009) :
Альтернативным способом представления результатов этой процедуры является представление скорректированных p значений. Скорректированные по ЧД значения p определяются как пB H( я )= мин { минj ≥ i{ м р( J )J} ,1 } .
Эта формула выглядит сложнее, чем есть на самом деле. Это говорит:
- Сначала упорядочьте все п от малого к большому. Затем умножьте каждое п значение на общее количество тестов м и разделите его по порядку рангов.
- Во-вторых, убедитесь, что результирующая последовательность неубывающая: если она когда-либо начинает уменьшаться, сделайте предыдущее значение п равным последующему (многократно, пока вся последовательность не станет неубывающей).
- Если какое-либо значение p окажется больше 1, сделайте его равным 1.
Это простая переформулировка первоначальной процедуры BH с 1995 года. Возможно, существует более ранняя статья, в которой явно вводится концепция скорректированных по BH p значений, но я не знаю ни о какой.
Обновить. @Zenit обнаружил, что Yekutieli & Benjamini (1999) описали то же самое еще в 1999 году:
Сначала ответ на вопрос. Предположим, что является значением p (одиночного теста), связанным со значением z 0 статистики теста. FDR Бенджамини-Хохберга вычисляется в два этапа ( N 0 = # pvalues ≤ p 0 , N = # pvalues):p0 p z0 N0 ≤ p0 N
Теперь давайте это поймем. (Байесовская) основная идея заключается в том, что наблюдения происходят из смеси двух распределений:
То, что наблюдается, является смесью этих двух:
(Байесовские) определения:
(На основе статистического вывода Эфрона и Тибширани о компьютерном веке )
источник