Точный тест Фишера в таблицах непредвиденных обстоятельств больше 2х2

29

Меня учили применять точный тест Фишера только в таблицах непредвиденных обстоятельств, которые были 2x2.

Вопросов:

  1. Сам Фишер когда-либо предполагал, что этот тест будет использоваться в таблицах размером более 2х2 (мне известно о том, как он разработал этот тест, пытаясь угадать, может ли пожилая женщина сказать, было ли молоко добавлено в чай ​​или чай был добавлен в молоко )

  2. Stata позволяет мне использовать точный тест Фишера для любой таблицы непредвиденных обстоятельств. Это действительно?

  3. Является ли предпочтительным использование FET, когда ожидаемое число ячеек в таблице непредвиденных обстоятельств <5?

pmgjones
источник
1
Возможно, вы захотите рассмотреть, насколько точным является точный тест Фишера: stat.columbia.edu/~gelman/research/published/isr.pdf (раздел 3.3)
о.
Вы можете вычислить точный критерий Фишера в R. Их метод на самом деле использует сетевой алгоритм, чтобы сделать его достаточно быстрым: stat.ethz.ch/R-manual/R-patched/library/stats/html/… См. Статью [Мехта и Патель 1986]
Симона

Ответы:

20

Единственная проблема, связанная с применением точного критерия Фишера к таблицам размером более 2х2, заключается в том, что вычисления становятся намного сложнее. Версия 2x2 - единственная, которая возможна даже вручную, и поэтому я сомневаюсь, что Фишер когда-либо представлял себе тест в больших таблицах, потому что вычисления были бы за пределами того, что он предполагал.

Тем не менее, тест может быть применен к любой таблице mxn, и некоторые программы, включая Stata и SPSS, предоставляют эту возможность. Несмотря на это, расчет часто аппроксимируется с использованием подхода Монте-Карло.

Да, если ожидаемое количество ячеек невелико, лучше использовать точный критерий, поскольку критерий хи-квадрат больше не является хорошим приближением в таких случаях.

Роб Хиндман
источник
Можете ли вы указать мне, где я могу найти документацию о том, как выполнить тест Фишера с использованием SPSS? Спасибо
biostat_newbie
Посмотрите под кросс-таблицы
Роб Хиндман
Учитывая, что в настоящее время программное обеспечение может выполнять вычисления так легко, есть ли обстоятельства, когда теоретически или практически критерий Хи-квадрат на самом деле предпочтительнее точного критерия Фишера?
pmgjones
Во многих случаях «точный» тест не является точным, и многие «приблизительные» методы имеют охват, близкий к номинальному уровню значимости. См., Например, Alan Agresti и Brent A. Coull (1998) «Приблизительно лучше, чем« точные »для интервальной оценки биномиальных пропорций» American Statistician , 52 (2): 119-126.
Мартен Буис
2
Каков примерно максимальный размер таблицы непредвиденных обстоятельств, который можно проанализировать точным методом Фишера за приемлемый период времени (скажем, неделю на стандартном ноутбуке)?
пир
6

Эта страница в MathWorld объясняет, как работают вычисления. Это указывает на то, что тест может быть определен различными способами:

Чтобы вычислить P-значение теста, таблицы должны быть упорядочены по некоторому критерию, который измеряет зависимость, и те таблицы, которые представляют равное или большее отклонение от независимости, чем наблюдаемая таблица, являются теми, чьи вероятности складываются вместе. Существует множество критериев, которые можно использовать для измерения зависимости.

Мне не удалось найти другие статьи или тексты, которые объясняют, как это делается с таблицами размером более 2х2.

Этот калькулятор вычисляет точный тест Фишера для таблиц с 2 столбцами и до 5 строк. Используемый критерий - это гипергеометрическая вероятность каждой таблицы. Общее значение P является суммой гипергеометрической вероятности всех таблиц с одинаковыми предельными итогами, вероятности которых меньше или равны вероятности, вычисленной из фактических данных.

Харви Мотульский
источник
3

Если вы ищете другие способы вычисления точного теста Фишера с большими таблицами непредвиденных обстоятельств, вот онлайн-калькулятор для точного теста Фишера для таблиц сопряженности 2x3 . Кроме того, вот один для таблиц на случай непредвиденных обстоятельств 3x3 и один для таблиц на случай непредвиденных обстоятельств 2x4 .

Да, если ожидаемое количество клеток небольшое, лучше использовать точный критерий Фишера, а не критерий хи-квадрат, если это возможно.

DW
источник
2

Чтобы получить точный тест Фишера в SPSS, используйте опцию Statistics = Exact в Crosstabs. Методы вычисления точного тедта для больших таблиц были известны как минимум с 1960-х годов. Скорость современных микропроцессоров делает время вычислений несущественным в наши дни. На самом деле, запустить Точный тест настолько просто, что важно не использовать его слишком широко.

СтатистикаДок Консалтинг
источник