Я сравниваю две группы мутантов, каждая из которых может иметь только один из 21 различных фенотипов. Я хотел бы посмотреть, одинаково ли распределение этих результатов между двумя группами. Я нашел онлайн-тест, который вычисляет «критерий хи-квадрат для равенства распределений» и дает мне некоторые правдоподобные результаты. Тем не менее, в этой таблице у меня довольно много нулей, так что я могу вообще использовать хи-квадрат в этом случае?
Вот таблица с двумя группами и количеством отдельных фенотипов:
2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1
Ответы:
В наши дни вполне возможно провести «точный» тест Фишера на таком столе. Я только что получил p = 0,087 с помощью Stata (
tabi 2 1 \ 2 3 \ .... , exact
. Выполнение заняло 0,19 секунды).РЕДАКТИРОВАТЬ после комментария chl ниже (попытался добавить как комментарий, но не может отформатировать):
Он работает в R 2.12.0 для меня, хотя мне пришлось увеличить опцию «рабочая область» по сравнению со значением по умолчанию 200000:
(Время выполнения немного быстрее, чем в Stata, но это имеет сомнительное значение, учитывая время, затрачиваемое на выяснение значения сообщения об ошибке, которое использует «рабочее пространство» для обозначения чего-то отличного от обычного значения R, несмотря на то, что fisher.test является частью основного пакета R статистики.)
источник
Обычные рекомендации заключаются в том, что ожидаемое количество должно быть больше 5, но его можно несколько ослабить, как обсуждалось в следующей статье:
Смотрите также домашнюю страницу Яна Кэмпбелла .
Обратите внимание, что в R всегда есть возможность вычислить значение методом Монте-Карло ( ) вместо того, чтобы полагаться на асимптотическое распределение.p
chisq.test(..., sim=TRUE)
В вашем случае кажется, что около 80% ожидаемых значений ниже 5, а 40% ниже 1. Имеет ли смысл объединять некоторые из наблюдаемых фенотипов?
источник