Филогенетически зависимые переменные: ANOVA?

13

Я понимаю, как получить ковариационную матрицу из филогенетических данных, чтобы сделать для двух переменных, по которым вы делаете регрессию. Но что произойдет, если у вас есть одна непрерывная переменная, которую вы ранее показали зависимой от филогении, и одна порядковая переменная? Последнее является порядковым, я не уверен, как это соотнести с тем, как филогенетическая зависимость приводит к смещенной статистике теста.cov(X,Y)=0

Имеет ли смысл рассчитывать филогенетически независимые контрасты Фельзенштейна по вашей непрерывной переменной и использовать их для вашей ANOVA?

Значение PIC:

Cij=(XiXj)dij

XiXi,XjXjdij - это попарное расстояние между видами и на филогенетическом дереве.ij

user1134516
источник
1
В CrossValidated достаточно прикладных статистиков, и мы можем рассмотреть вопрос о переносе этого на сайт статистики.
Даниэль Стендж
2
Я бы порекомендовал список рассылки r-sig-phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Даже если вы не используете R для анализа, вы получите очень хорошие ответы на свой вопрос.
KMM

Ответы:

1

Первым шагом, который я бы порекомендовал, является введение фиктивной переменной для каждого порядкового класса (см. Комментарии на странице https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta .edu / faculty / kunovich / Soci5304_Handouts / Topic% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ-2-ая сумма в 2 тысячи фунтов стерлингов в зависимости от объема продаж и продаж в зависимости от ценовой категории: 2 млрд. фунтов ст . Вы также можете проверить тенденцию в самих фиктивных переменных. Вы также можете переупорядочить категорию порядковых переменных в соответствии с соответствующей оценочной величиной фиктивных переменных для последующего анализа, если для этого есть предварительное (для просмотра текущих данных) обоснование.

Предполагая, что в предыдущем анализе отсутствует растущий эффект тренда (не обязательно линейный), и включается любое поддерживаемое упорядочение в самой порядковой переменной, интересный подход, который также учитывает возможные проблемы нормальности, заключается в проведении регрессионного анализа, в котором всем переменным присваиваются ранги, включая порядковый номер переменной Обоснование этого безумия - цитата из Википедии о коэффициенте корреляции ранга Спирмена (ссылка: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

«Коэффициент Спирмена, как и любой расчет корреляции, подходит как для непрерывных, так и для дискретных переменных, включая порядковые переменные. [1] [2]»

Википедия представляет пример и несколько способов оценки стандартной ошибки вычисленной ранговой корреляции для тестирования. Обратите внимание, что если он статистически не отличается от нуля, то масштабированная версия, как и в вычисленной регрессии, основанной на рангах, аналогично не имеет значения.

Я бы далее нормализовал эти ранги (поделив на количество наблюдений), предоставив возможную выборочную интерпретацию квантиля (обратите внимание, что возможны уточнения в построении эмпирического распределения для рассматриваемых данных). Я также выполнил бы простую корреляцию между y и заданной преобразованной порядковой переменной, чтобы направление выбранного вами ранжирования (например, от 1 до 4 против 4 к 1) давало знак для ранговой корреляции, которая имеет интуитивное значение в контексте вашего исследования.

[Редактировать] Обратите внимание, что модели ANOVA могут быть представлены в формате регрессии с соответствующей матрицей проектирования, и с любой стандартной регрессионной моделью, которую вы исследуете, центральной темой является анализ на основе среднего значения Y с учетом X. Однако в некоторых дисциплинах, таких как экология, Различное внимание к регрессионным отношениям, подразумеваемым в различных квантилях, включая медиану, оказалось плодотворным. Очевидно, что в экологии средние эффекты могут быть небольшими, но не обязательно таковыми в других квантилях. Это поле называется квантильной регрессией. Я бы посоветовал вам использовать его для дополнения вашего текущего анализа. В качестве справочного материала вы можете найти документ 213-30 «Введение в квантильную регрессию и процедуру QUANTREG» Колина (Лин) Чена из Института SAS.

Вот также источник об использовании ранговых преобразований: «Использование ранговых преобразований в регрессии» Рональда Л. Имана и У. Дж. Коновера, опубликовано в Technometrics, том 21, № 4, ноябрь 1979 года. В статье отмечается, что регрессии Использование ранговых преобразований, по-видимому, хорошо работает на монотонных данных. Это мнение разделяют и специалисты по надежности, которые заявляют в онлайн-журнале, чтобы процитировать: «Метод оценки регрессии ранга весьма хорош для функций, которые можно линеаризовать». Источник: «Надежность Hotwire», выпуск 10, декабрь 2010 г.

AJKOER
источник
анонимный пользователь пытался внести в ваш пост довольно подробные (IMO) изменения. Если вы не согласны с ними, вы можете откатить их, нажав ссылку «отредактировано __ назад», найдя последнюю версию, которую вы предпочитаете, и нажав «откат».
gung - Восстановить Монику
0

Филогенетический тест ANOVA был разработан Garland et al. (1993) , и реализован в phy.anovaфункции в geigerпакете. Метод дает значения p, скорректированные с учетом филогенетической независимости, путем генерирования нулевого распределения на основе имитации эволюции филогении.

Медленный Лорис
источник