Почему в тесте Макнемара используется хи-квадрат, а не нормальное распределение?

11

Я только что заметил, как в неточном тесте Макнемара используется асимптотическое распределение хи-квадрат. Но поскольку точный тест (для таблицы двух случаев) основан на биномиальном распределении, почему не принято предлагать нормальное приближение к биномиальному распределению?

Спасибо.

Таль Галили
источник

Ответы:

15

Близкий к интуитивному ответу:

Присмотритесь к формуле для теста Макнемара, учитывая таблицу

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

Статистика Макнемара Mрассчитывается как:

Mзнак равно(б-с)2б+с

Определение распределения с k степенями свободы состоит в том, что оно состоит из суммы квадратов k независимых стандартных нормальных переменных. если 4 числа достаточно велики, а , следовательно, и могут быть аппроксимированы нормальным распределением. Учитывая формулу для M, легко увидеть, что при достаточно больших значениях действительно будет следовать с 1 степенью свободы.х 2χ2bcb-cb+cMχ2


РЕДАКТИРОВАТЬ: Как справедливо указано onstop, нормальное приближение на самом деле полностью эквивалентно. Это довольно тривиально, учитывая аргумент, использующий приближение b-cпо нормальному распределению.

Точная биноминальная версия также эквивалентна знаковому тесту в том смысле, что в этой версии биномиальное распределение используется для сравнения bс . Или мы можем сказать, что при нулевой гипотезе распределение b может быть аппроксимировано .N ( 0,5 × ( b + c ) , 0,5 2 × ( b + c )ВяNом(б+с,0,5)N(0,5×(б+с),0,52×(б+с)

Или, что эквивалентно:

б-(б+с2)б+с2~N(0,1)

что упрощает до

б-сб+с~N(0,1)

или, если взять квадрат с обеих сторон, в .M~χ12

Следовательно, нормальная аппроксимация будет использоваться. Это то же самое, что и приближение .χ2

Йорис Мейс
источник
3
Это правильно. Возможно, связь можно увидеть более четко, рассматривая Sqrt (M) = (bc) / Sqrt (b + c). Приближая дисперсию b как b и дисперсию c как c (как обычно для подсчитанных данных), мы видим, что Sqrt (M) выглядит как приблизительно нормальная переменная (bc), деленная на ее стандартное отклонение: другими словами, она выглядит как стандартная нормальная вариация. Фактически, мы могли бы провести эквивалентный тест, сослав Sqrt (M) в таблицу стандартного нормального распределения. Квадрат эффективно делает тест симметричным двусторонним. Очевидно, что это сломается, если либо b, либо c мало.
uuber
Спасибо за интуитивный ответ Joris. Тем не менее, почему чаще используется это приближение, чем обычное приближение к точному биномиальному критерию Макнемара?
Тал Галили
@Tal: Это то же самое. Смотрите нонстопс, ответ и мои правки.
Джорис Meys
Собственно - последний вопрос. Так что, если оба они идентичны (и я думаю, что вам также может понадобиться «абсолютное значение» вокруг bc), то почему люди переходят к распределению ци, а не остаются с нормальным? Где преимущество?
Тал Галили
1
@Tal: Вы знаете, что R. нанесите chi2 с одной степенью свободы, вот увидите.
Йорис Мейс
8

Разве два подхода не сводятся к одному и тому же? Соответствующее распределение хи-квадрат имеет одну степень свободы, так что это просто распределение квадрата случайной величины со стандартным нормальным распределением. Мне нужно пройти через алгебру, чтобы проверить, что у меня сейчас нет времени, но я был бы удивлен, если бы вы не получили одинаковый ответ в обоих направлениях.

одна остановка
источник
смотрите мой ответ для дальнейшей разработки
Joris Meys
Привет onetop - Так как оба являются асимптотическими, то для меньших N они могут дать несколько разные результаты. В таком случае мне интересно, будет ли выбор идти с хи-квадратом, потому что он лучше, чем нормальное приближение, или по историческим причинам (или, может быть, как вы предположили - они всегда дают одинаковые результаты)
Тал Галили
@Tal: для меньшего N ни то, ни другое не выполняется. И, как показано в моем редактировании, они точно такие же.
Джорис Meys