Почему контроль FDR менее строг, чем контроль FWER?

16

Я читал, что контроль FDR менее строг, чем контроль FWER, например, в Википедии :

Процедуры контроля FDR обеспечивают менее строгий контроль над ложным обнаружением по сравнению с процедурами семейной частоты ошибок (FWER) (такими как коррекция Бонферрони). Это увеличивает мощность за счет увеличения частоты ошибок типа I, то есть отвергает нулевую гипотезу отсутствия эффекта, когда она должна быть принята.

Но мне было интересно, как это подтверждается математически?

Есть ли какая-то связь между FDR и FWER?

StackExchange для всех
источник
4
Вы читали оригинальную статью? Это почти все, на что можно надеяться в статистической работе: единственная фундаментальная идея, ясная и краткая история, полезный пример и (короткие!) Точные доказательства.
кардинал

Ответы:

10

Действительно, @cardinal совершенно прав, что статья настолько ясна, насколько это возможно. Итак, для чего бы это ни стоило, в случае, если у вас нет доступа к статье, вот немного проработанная версия того, как Бенджамини-Хохберг утверждает:

FDR - это ожидаемое значение доли ложных отклонений v от всех отклонений r . Теперь r , очевидно, является суммой ложных и правильных отклонений; позвоните последним с .Qevrrs

Таким образом, (используя заглавные буквы для случайных величин и строчные буквы для реализованных значений),

Qe=E(VR)=E(VV+S)=:E(Q).

Один принимает если R = 0 .Q=0R=0

Теперь, есть две возможности: либо все обнуляет истинны или просто т 0 < м из них истинны. В первом случае не может быть правильных отклонений, поэтому r = v . Таким образом, если есть отклонения ( r 1 ), q = 1 , в противном случае q = 0 . Следовательно,mm0<mr=vr1q=1q=0

FDR=E(Q)=1P(Q=1)+0P(Q=0)=P(Q=1)=P(V1)=FWER

Таким образом, в этом случае, так что любая процедура, которая контролирует F D R, тривиально также контролирует F W E R и наоборот.FDR=FWERFDRFWER

Во втором случае, когда , если v > 0 (то есть, если есть хотя бы одно ложное отклонение), мы, очевидно, имеем (это дробь с также v в знаменателе), что v / r 1 . Это означает , что функция индикатора , который принимает значение 1 , если существует, по крайней мере , одно ложное отторжение, 1 V 1 никогда не будет меньше , чем Q , 1 V 1Q . Теперь возьмем ожидание по обе стороны от неравенства, которое по монотонности Em0<mv>0vv/r11V1Q1V1QE оставляет неравенство нетронутым,

E(1V1)E(Q)=FDR

E(1V1)=P(V1)FWER

Thus, when we have a procedure that controls the FWER in the sense that FWERα, we must have that FDRα.

Conversely, having FDR control at some α may come with a substantially larger FWER. Intuitively, accepting a nonzero expected fraction of false rejections (FDR) out of a potentially large total of hypotheses tested may imply a very high probability of at least one false rejection (FWER).

So, a procedure has to be less strict when only FDR control is desired, which is also good for power. This is the same idea as in any basic hypothesis test: when you test at the 5% level you reject more frequently (both correct and false nulls) than when testing at the 1% level simply because you have a smaller critical value.

Christoph Hanck
источник
2
(+1) Good exposition. Obviously, in the first case we can also say FWER control implies FDR control (which is the matter in question). Also, it may be worth pointing out that this property comes with no distributional assumptions (e.g., independence) on the test statistics, unlike the procedure given in the original paper for control of the FDR.
cardinal