Я выполняю независимых статистических тестов с одинаковой нулевой гипотезой и хотел бы объединить результаты в одно значение. Кажется, что есть два «принятых» метода: метод Фишера и метод Стоуффера .
Мой вопрос о методе Стоуффера. Для каждого отдельного теста я получаю z-оценку . Под нулевой гипотезой, каждый из них распределяются со стандартным нормальным распределением, так что сумма следует нормальному распределению с дисперсией . Поэтому метод Стоуффера предлагает вычислить , который должен обычно распределяться с дисперсией единицы, и затем использовать это как объединенную z-оценку.
Это разумно, но вот еще один подход, который я предложил, и который также звучит разумно для меня. Поскольку каждое из происходит из стандартного нормального распределения, сумма квадратов должна из распределения хи-квадрат с степенями свободы. Таким образом, можно вычислить и преобразовать его в значение, используя кумулятивную функцию распределения хи-квадрат с степенями свободы ( , где - CDF).
Однако нигде я не могу найти этот подход даже упомянутым. Это когда-либо использовалось? У него есть имя? Каковы будут преимущества / недостатки по сравнению с методом Стоуффера? Или в моих рассуждениях есть недостаток?
источник
Ответы:
Одним из недостатков, который выпадает, является то, что метод Стоуффера может обнаруживать систематические сдвиги в , что обычно можно ожидать, когда одна альтернатива неизменно верна, в то время как метод хи-квадрат, по-видимому, обладает меньшими возможностями для этого. Быстрое моделирование показывает, что это так; метод хи-квадрат менее эффективен для обнаружения односторонней альтернативы. Здесь приведены гистограммы p-значений обоими методами (красный = Стоуффер, синий = хи-квадрат) для независимых итераций с и различными односторонними стандартизированными эффектами диапазоне от none ( ) через SD ( ).10 5 N = 10 μ μ = 0 0,6 μ = 0,6zi 105 N=10 μ μ=0 0.6 μ=0.6
Лучшая процедура будет иметь большую площадь, близкую к нулю. Для всех показанных положительных значений эта процедура является процедурой Стуффера.μ
Код R
Это включает в себя метод Фишера (закомментированный) для сравнения.
источник
R
симуляцию, чтобы проверить это. Это был бы хороший способ представить себя этой статистической вычислительной платформе. :-)Один из общих способов получить представление о статистике тестирования - это вывести (как правило, неявные) базовые предположения, которые позволят сделать эту статистику теста наиболее эффективной. Для этого конкретного случая студент и я недавно сделали это: http://arxiv.org/abs/1111.1210v2 (пересмотренная версия должна появиться в «Анналах прикладной статистики»).
Чтобы очень кратко суммировать (и в соответствии с результатами моделирования в другом ответе) метод Стоуффера будет наиболее мощным, когда «истинные» базовые эффекты все равны; сумма Z ^ 2 будет наиболее сильной, когда лежащие в основе эффекты обычно распределяются около 0. Это небольшое упрощение, которое опускает детали: см. раздел 2.5 в препринте arxiv, связанном выше, для более подробной информации.
источник
Немного о / т: одной из проблем обоих этих подходов является потеря мощности из-за степеней свободы (N для Стоуффера; 2N для Фишера). Для этого были разработаны лучшие метааналитические подходы, которые вы, возможно, захотите рассмотреть (например, взвешенный метаанализ с обратной дисперсией).
Если вы ищете доказательства каких-то альтернативных тестов в группе, вы можете посмотреть статистику критики Донохо и Джина: https://projecteuclid.org/euclid.aos/1085408492
источник
Чтобы ответить на этот вопрос и для дальнейших читателей: используется ли он когда-либо ?, есть исчерпывающая статья Cousins (2008) об arXiv, в которой перечислены и рассмотрены несколько альтернативных подходов. Предлагаемый, похоже, не появляется.
источник