Тест хи-квадрат на равенство распределений: сколько нулей он терпит?

10

Я сравниваю две группы мутантов, каждая из которых может иметь только один из 21 различных фенотипов. Я хотел бы посмотреть, одинаково ли распределение этих результатов между двумя группами. Я нашел онлайн-тест, который вычисляет «критерий хи-квадрат для равенства распределений» и дает мне некоторые правдоподобные результаты. Тем не менее, в этой таблице у меня довольно много нулей, так что я могу вообще использовать хи-квадрат в этом случае?

Вот таблица с двумя группами и количеством отдельных фенотипов:

2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1
Membran
источник
Стол не вышел правильно. Каждое нечетное число является счетом из группы 1, и каждое четное число является соответствующим счетом из группы 2
Мембран
Я переформатировал ваш вопрос. Таблица сейчас верна?
csgillespie

Ответы:

8

В наши дни вполне возможно провести «точный» тест Фишера на таком столе. Я только что получил p = 0,087 с помощью Stata ( tabi 2 1 \ 2 3 \ .... , exact. Выполнение заняло 0,19 секунды).

РЕДАКТИРОВАТЬ после комментария chl ниже (попытался добавить как комментарий, но не может отформатировать):

Он работает в R 2.12.0 для меня, хотя мне пришлось увеличить опцию «рабочая область» по сравнению со значением по умолчанию 200000:

> fisher.test(x)
Error in fisher.test(x) : FEXACT error 7.
LDSTP is too small for this problem.
Try increasing the size of the workspace.
> system.time(result<-fisher.test(x, workspace = 400000))
   user  system elapsed 
   0.11    0.00    0.11 
> result$p.value
[1] 0.0866764

(Время выполнения немного быстрее, чем в Stata, но это имеет сомнительное значение, учитывая время, затрачиваемое на выяснение значения сообщения об ошибке, которое использует «рабочее пространство» для обозначения чего-то отличного от обычного значения R, несмотря на то, что fisher.test является частью основного пакета R статистики.)

универсальный
источник
1
Интересно, что тест Фишера рухнул на R.
Chl
Не могу больше проголосовать, извините. Кажется , я не увеличить wksp достаточно :)
CHL
Не правда ли, что «точный» тест Фишера на самом деле затрагивает несколько иной вопрос: «... он используется для проверки значимости ассоциации (случайности) между двумя видами классификации» (вики-страница). В моем случае я стремился подтвердить (или опровергнуть) гипотезу о том, что распределения фенотипов между двумя группами похожи (равны). Когда я обнаружил, что онлайн-тест (см. Первый пост) под названием «Критерий хи-квадрат для равенства распределений», я подумал, что это именно для моей задачи ...
Мембран
Кроме того, если вы считаете, что упомянутая версия теста Фишера подходит для сравнения двух распределений, ее также можно использовать для проверки равномерности распределения (т. Е. Сказать, что фенотипы в одной группе были распределены неравномерно между конечным числом возможных фенотипов) ? Это можно сделать даже в Excel, используя функцию CHITEST, но что, если у меня есть распределение, подобное приведенному выше, с большим количеством фенотипов, наблюдаемых менее 5 раз?
Мембран
@Membran # 1: Это немного другой вопрос, поскольку точные условия теста Фишера для обоих наборов предельных итогов. Хотя мне это кажется чем-то вроде академической статистической сложности, и я статистик в академии. (Кстати, не могли бы вы уточнить, на какую вики вы ссылаетесь?) @Membran # 2: я бы не назвал условный точный тест «точным тестом Фишера» в случае односторонней таблицы, но такой тест должен быть возможен. Я бы подумал, что для односторонних таблиц проще, но в настоящее время я не могу найти программное обеспечение, которое бы мне помогло, и у меня нет времени выполнять вычисления без него.
остановка
5

Обычные рекомендации заключаются в том, что ожидаемое количество должно быть больше 5, но его можно несколько ослабить, как обсуждалось в следующей статье:

Тесты Кэмпбелла, I, Хи-квадрат и Фишера-Ирвина для таблиц два на два с рекомендациями для небольшой выборки , Статистика в медицине (2007) 26 (19): 3661–3675.

Смотрите также домашнюю страницу Яна Кэмпбелла .

Обратите внимание, что в R всегда есть возможность вычислить значение методом Монте-Карло ( ) вместо того, чтобы полагаться на асимптотическое распределение.pchisq.test(..., sim=TRUE)

В вашем случае кажется, что около 80% ожидаемых значений ниже 5, а 40% ниже 1. Имеет ли смысл объединять некоторые из наблюдаемых фенотипов?

хл
источник
Спасибо за предложения. По логике вещей, объединить фенотипы не представляется возможным, поскольку каждый из них представляет собой уникальную комбинацию трех зарегистрированных параметров. Поскольку каждый из этих параметров может быть «вверх», «вниз» или оставаться «неизменным» в результате мутации, то может быть 3 ^ 3 = 27 различных фенотипов. В приведенном выше примере я удалил те фенотипы, для которых обе группы набрали «0», поэтому их было только 21. Я вижу распространенность определенных фенотипов, но мне хотелось бы получить некоторые статистические доказательства того, что распределение таких фенотипов в различных группах мутантов одинаково (или нет). Спасибо!
Мембран
1
@Membran Агрегация не должна быть осмысленной: вы можете комбинировать лотки любым удобным для вас способом. Однако тонкая проблема заключается в том, что постфакторная агрегация ставит р-значения под сомнение; агрегация должна быть независимой от данных.
whuber