Вопросы с тегом «genetics»

Научное изучение принципов наследственности и вариации наследственных признаков между родственными организмами.

76
Выбор функции для «окончательной» модели при выполнении перекрестной проверки в машинном обучении

Я немного запутался в выборе функций и машинном обучении, и мне было интересно, можете ли вы помочь мне. У меня есть набор данных микрочипов, который классифицируется на две группы и имеет 1000 функций. Моя цель - получить небольшое количество генов (мои особенности) (10-20) в сигнатуре, которую я...

26
Насколько вероятно, что я произошла от определенного человека, родившегося в 1300 году?

Другими словами, исходя из следующего, что такое p? Чтобы сделать это математической проблемой, а не антропологией или общественными науками, и упростить задачу, предположим, что пары выбираются с равной вероятностью среди населения, за исключением того, что братья и сестры никогда не спариваются,...

24
Исправление значений p для нескольких тестов, где тесты коррелированы (генетика)

У меня есть p значений из многих тестов, и я хотел бы знать, есть ли на самом деле что-то существенное после исправления для множественного тестирования. Сложность: мои тесты не являются независимыми. Метод, о котором я думаю (вариант метода продукта Фишера, Зайкин и др., Genet Epidemiol , 2002),...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

20
Каковы основные компоненты в исследованиях ассоциаций всего генома?

В общегеномных ассоциативных исследованиях (GWAS): Каковы основные компоненты? Почему они используются? Как они рассчитываются? Можно ли провести исследование ассоциации всего генома без использования PCA?...

15
Как работает квантильная нормализация?

В исследованиях экспрессии генов с использованием микрочипов данные интенсивности должны быть нормализованы, чтобы можно было сравнивать интенсивности между индивидуумами, между генами. Концептуально и алгоритмически, как работает «квантильная нормализация», и как бы вы объяснили это не...

13
Вычисление вероятности совпадения списка генов между последовательностью РНК и набором данных чипа

Надеюсь, кто-то на этих форумах поможет мне с этой основной проблемой в исследованиях экспрессии генов. Я сделал глубокое секвенирование экспериментальной и контрольной ткани. Затем я получил значения кратного обогащения генов в экспериментальном образце для контроля. Эталонный геном имеет ~ 15 000...

11
Мягкая порога против штрафной санкции Лассо

Я пытаюсь обобщить то, что я до сих пор понимал в многомерном анализе наказаний с помощью многомерных наборов данных, и я все еще борюсь за то, чтобы получить правильное определение мягкого порогового определения по сравнению с штрафом Лассо (или ).L1L1L_1 Точнее, я использовал разреженную...

11
Анализ мощности для анализа выживания

Если я предполагаю, что генная сигнатура идентифицирует субъектов с более низким риском рецидива, то есть снижение на 0,5 (коэффициент риска 0,5) частоты событий у 20% населения, и я намерен использовать образцы из ретроспективного когортного исследования. размер выборки необходимо скорректировать...

11
Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?

Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в...

11
Анализ обогащения по уровню дупликации генов

Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию....

10
Расстояние Махаланобиса через PCA, когда

У меня есть матрица , где - количество генов, а - количество пациентов. Любой, кто работал с такими данными, знает, что всегда больше, чем . Используя выбор функции, я получил к более разумному числу, однако все еще больше, чем .p n p n p p nn×pn×pn\times ppppnnnpppnnnppppppnnn Я хотел бы вычислить...

9
Использование срединного лака для выбора характеристик

В статье, которую я недавно читал, я обнаружил в своем разделе анализа данных следующее: Затем таблица данных была разбита на ткани и клеточные линии, и две подтаблицы были отдельно отшлифованы по медиане (строки и столбцы были итеративно скорректированы, чтобы иметь медиану 0), прежде чем они были...

9
Как рассчитать доверительные интервалы для объединенных нечетных отношений в метаанализе?

У меня есть два набора данных из общих исследований генома ассоциации. Единственной доступной информацией являются нечетные отношения и их доверительные интервалы (95%) для каждого генотипированного SNP. Я хочу создать лесной участок, сравнивая эти два коэффициента, но я не могу найти способ...

9
Как рассчитать стандартную ошибку коэффициентов шансов?

У меня есть два набора данных из общих исследований генома ассоциации. Единственная доступная информация - это отношение шансов и значение p для первого набора данных. Для второго набора данных у меня есть отношение шансов, р-значение и частоты аллелей (AFD = болезнь, AFC = контроль) (например,...

9
Как детям удается объединить своих родителей в прогнозе PCA набора данных GWAS?

Возьмите 20 случайных точек в 10000-мерном пространстве с каждой координатой из N( 0 , 1 )N(0,1)\mathcal N(0,1) . Разделите их на 10 пар («пары») и добавьте среднее значение каждой пары («ребенок») к набору данных. Затем проведите PCA по полученным 30 точкам и постройте график PC1 против PC2....