Какова формула для скорректированного p-значения Бенджамини-Хохберга?

14

Я понимаю процедуру и то, что она контролирует. Итак, какова формула для скорректированного значения p в процедуре ЧД для множественных сравнений?


Только сейчас я понял, что исходная ЧД не выдает скорректированные значения p, а только скорректировала (не) условие отклонения: https://www.jstor.org/stable/2346101 . Гордон Смит в любом случае ввел скорректированные p-значения ЧД в 2002 году, поэтому этот вопрос остается в силе. Это реализовано в R как p.adjustс методом BH.

поджигатель
источник

Ответы:

6

В известной оригинальной статье Benjamini & Hochberg (1995) описана процедура принятия / отклонения гипотез, основанная на корректировке уровней альфа. Эта процедура имеет простую эквивалентную переформулировку в терминах скорректированных p значений, но она не обсуждалась в оригинальной статье. По словам Гордона Смита , он ввел скорректированные p в 2002 году при реализации p.adjustв R. К сожалению, нет соответствующей цитаты, поэтому мне всегда было неясно, на что следует ссылаться, если использовать p -значения, скорректированные с помощью BH .

Оказывается, процедура описана в Benjamini, Heller, Yekutieli (2009) :

Альтернативным способом представления результатов этой процедуры является представление скорректированных p значений. Скорректированные по ЧД значения p определяются как

п(я)ВЧАСзнак равномин{минJя{мп(J)J},1},

Эта формула выглядит сложнее, чем есть на самом деле. Это говорит:

  1. Сначала упорядочьте все п от малого к большому. Затем умножьте каждое п значение на общее количество тестов м и разделите его по порядку рангов.
  2. Во-вторых, убедитесь, что результирующая последовательность неубывающая: если она когда-либо начинает уменьшаться, сделайте предыдущее значение п равным последующему (многократно, пока вся последовательность не станет неубывающей).
  3. Если какое-либо значение p окажется больше 1, сделайте его равным 1.

Это простая переформулировка первоначальной процедуры BH с 1995 года. Возможно, существует более ранняя статья, в которой явно вводится концепция скорректированных по BH p значений, но я не знаю ни о какой.


Обновить. @Zenit обнаружил, что Yekutieli & Benjamini (1999) описали то же самое еще в 1999 году:

введите описание изображения здесь

амеба говорит восстановить монику
источник
Это ответ, который я ожидал, +1. Я помню, как читал о реализации Гордоном Смитом скорректированного значения p, а также не знал, кого цитировать, здорово видеть, что здесь есть «каноническая» цитата.
Firebug
1
Я полагаю, что существует даже более ранняя ссылка: Yekutieli and Benjamini (1999) (PDF-версия доступна здесь ). Определение 2.4 описывает, как оригинальная процедура FDR 1995 года может быть перефразирована в терминах скорректированных значений p. Кредит на этот пост в блоге, где я нашел об этом.
Зенит
@ Зенит Ого! Отличная находка! Я должен обновить свой ответ.
говорит амеба: восстанови Монику
Спасибо за источник @Zenit! Довольно странно, что такой вездесущий статистический метод не имеет общеизвестной ссылки.
Firebug
8

Сначала ответ на вопрос. Предположим, что является значением p (одиночного теста), связанным со значением z 0 статистики теста. FDR Бенджамини-Хохберга вычисляется в два этапа ( N 0 = # pvalues p 0 , N = # pvalues):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Теперь давайте это поймем. (Байесовская) основная идея заключается в том, что наблюдения происходят из смеси двух распределений:

  • π0Nf0(z)
  • (1π0)Nf1(z)

То, что наблюдается, является смесью этих двух:

  • f(z)=π0f0(z)+(1π0)f1(z)

введите описание изображения здесь

(Байесовские) определения:

  • Fdr=π0(1F0(z0))(1F(z))
  • fdr=π0f0(z0)f(z)

π01

введите описание изображения здесь

(На основе статистического вывода Эфрона и Тибширани о компьютерном веке )

Адитья
источник