Какой статистический тест следует использовать для проверки обогащения списков генов?

10

Я провел эксперимент, чтобы проверить клеточную чувствительность к определенному агенту повреждения ДНК. Мы обнаружили 270 генов, которые были специфически чувствительны к препарату, и общее количество проанализированных генов составило 3668. 38 из 270 чувствительных генов классифицируются как «гены репарации ДНК». Если количество «генов репарации ДНК», содержащихся в геноме, равно 112, а общее количество генов в геноме - 3668, обогащены ли чувствительные гены генами репарации ДНК? Какой статистический тест следует использовать? Я был бы признателен, если бы вы могли также рассказать мне какой-нибудь инструмент для расчета p-значения в Интернете.

Лаура
источник

Ответы:

17

2×2

Ремонт ДНКДругойчувствительный38232270Не чувствительный74332433981123556

Вы можете провести тестирование Rследующим образом:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Что дает весьма значительный результат:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Обратите внимание, что, поскольку мы проверяем избыточное представление (а не недопредставление), для alternativeпараметра устанавливается значение "greater".

М. Берк
источник
1
Большое спасибо за ваш ответ. Я также подумал, что точный тест Фишера может быть хорошим методом для анализа. У меня нет статистического программного обеспечения для выполнения результатов для других функциональных классов, которые я тоже хотел бы проверить. Знаете ли вы какой-либо онлайн-инструмент для получения значений со всеми десятичными знаками?
Лора
1
Вы можете скачать R бесплатно. Смотрите r-project.org. Таким образом, отсутствие программного обеспечения может быть решено (и думать, что вам нужен способ онлайн-расчета, неверно). Но, пожалуйста, сделайте небольшой поиск, чтобы узнать эти вещи для себя. См. Совет по stats.stackexchange.com/help/how-to-ask по вопросу хорошего вопроса.
Ник Кокс
@ Ник Ваш совет хорош, но, пожалуйста, не называйте его как характеристику плаката: такую ​​фразу слишком легко понять как атаку, которую, я сомневаюсь, вы намеревались. Поэтому я удалил предварительную фразу в вашем комментарии (которая не добавила никакой информации).
whuber
Отличный онлайн-инструмент для этого: mathcelebrity.com/fishers_exact_test.php
Не могли бы вы объяснить дополнительно, чрезмерное представление того, что именно рассчитывается?
sdgaw erzswer