Является ли наблюдаемая частота аллелей значительно меньше предсказанной?

10

Вопрос : Как я могу построить тест, чтобы определить, является ли наблюдаемая частота "горных" аллелей (Рис. 1) значительно ниже в центральных и южных горах, чем прогнозируется (Рис. 2) моделью экологического отбора ( подробности см. Ниже )?

Проблема : Моя первоначальная мысль состояла в том, чтобы регрессировать остатки модели в зависимости от широты: долготы и высоты (что приводит к значительному взаимодействию между широтой и долготой). Проблема заключается в том, что остатки (рис. 3) могут отражать вариации, не объясненные моделью, и / или что они представляют собой нечто биологическое, например, аллель не успел распространиться на юг до своего потенциала или существует некоторый барьер для потока генов. Если вы сравните наблюдаемые (Рис. 1) и ожидаемые (Рис. 2) частоты аллелей гор, вы увидите очевидную разницу, особенно в центральных и южных горах Швеции и Норвегии. Я принимаю, что модель не может объяснить все вариации, но могу ли я найти разумный тест для изучения идеи о том, что аллель гор не достиг своего потенциала в центральных и южных горах?

ФонУ меня есть биаллельный AFLP-маркер, распределение частот которого, по-видимому, связано с горными (и широтными: долготными) средами обитания в низменностях на Скандинавском полуострове (рис. 1). «Горный» -аллель почти закреплен на севере, который гористый. Он почти отсутствует или зафиксирован для "низменности" -аллели на юге, где нет гор. Когда в горах кто-то движется с севера на юг, «горный» аллель встречается с меньшей частотой. Это различие в частоте "горных" аллелей с севера на юг может быть просто связано с филогеографией или историческими процессами, поскольку регион был колонизирован как с севера, так и с юга. Например, если горный аллель происходит из северной популяции, возможно, он не успел полностью расшириться до южной популяции,

Моя рабочая гипотеза состоит в том, что частота "горных" аллелей является результатом экологического отбора (нулевая гипотеза - это нейтральный отбор).

Для моей модели экологического отбора я использовал обобщенную аддитивную модель (GAM) с частотой биномиального аллеля в качестве переменной отклика (129 участков, отобранных по всей Фенноскандинавии, с типично от 10 до 20 особей, отобранных на каждом участке) и несколько климатических и вегетационных переменных, как переменные предиктора. Результаты модели следующие (TMAX04-06 = максимальная температура в апреле-июне, Phen_NPPMN = средняя продуктивность вегетационного периода вегетации, PET_HE_YR = годовая потенциальная эвапотранспирация, Dist_Coast = расстояние до побережья):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

введите описание изображения здесь

Рисунок 1. Наблюдаемая частота «горных» аллелей для биаллельного маркера AFLP. Контурные линии 0,1 частотных интервалов, цветовые оттенки - это высота с синим для самого низкого и красного для самого высокого.

введите описание изображения здесь

Рис. 2. Прогнозируемая частота «горных» аллелей для биаллельного маркера AFLP. Контурные линии 0,1 частотных интервалов, цветовые оттенки - это высота с синим для самого низкого и красного для самого высокого.

введите описание изображения здесь

Рисунок 3. Экологическая модель отбора (с использованием GAM) с разбивкой по всей области исследования (Фенноскандинавия) и отдельно для Норвегии, Швеции и Финляндии. Красные пунктирные линии представляют вторичную зону контакта между северной и южной популяциями, выведенную из других маркеров AFLP, и анализ стабильных изотопов перьев, выращенных на их отдельных участках зимовки в Африке. Тонкая черная пунктирная линия является центром зоны.

Кит Ларсон
источник
1
Спасибо за большое количество деталей. Как нулевая модель возникает в вопросе? Похоже, что при сравнении наблюдаемого с ожидаемым имеет значение только модель экологического отбора.
gui11aume
Каковы ваши реальные данные здесь? Выходные данные модели говорят «n = 129», но это 129 человек или 129 местоположений, в каждом из которых у вас есть частоты аллелей, или ...?
2012 года
Извините, я хотел предоставить как можно больше информации, чтобы вы все могли лучше понять логику (или нелогичность) моего подхода к разрабатываемой мною рукописи. Мой вопрос стоит на вершине, я хотел бы найти причину, чтобы определить, существенно ли отличается разница между наблюдаемым и ожидаемым. Это может информировать меня о том, распространяется ли аллель или есть какой-то барьер для достижения ожидаемого значения. Что касается «N = 129», так как это частота аллелей, это означает 129 сайтов, в которых, как правило, от 10 до 20 особей, отобранных на каждом сайте.
Кит Ларсон
Вы упоминаете, что особи, кажется, являются панимистическими для материнских и аутосомных локусов. У вас есть доступ к этим данным? Как вы оценили панмиксию?
Самер

Ответы:

1

Этот вопрос может быть мертвым, но графики здесь великолепны, и ответ здесь кажется интуитивно очевидным. Если вы ищете «горный» аллель, очевидным выбором будет использование высоты (или ее суррогата) в качестве предиктора. Если бы это показало значительную связь с частотой аллелей, это послужило бы убедительным доказательством вашей гипотезы.

Вы можете добавить больше переменных-предикторов, описывающих другие аспекты горы, кроме ее высоты - например, «шероховатость» местности или тип растительности - которые являются уникально гористыми и могут также быть связаны с частотой аллелей.

Майкл К
источник