Почему тест Мантеля предпочтительнее теста Морана I?

37

Тест Мантеля широко используется в биологических исследованиях для изучения корреляции между пространственным распределением животных (положение в пространстве), например, с их генетическим родством, скоростью агрессии или каким-либо другим атрибутом. Множество хороших журналов используют его ( PNAS, Поведение животных, Молекулярная экология ... ).

Я изготовил некоторые паттерны, которые могут встречаться в природе, но тест Мантеля кажется совершенно бесполезным для их обнаружения. С другой стороны, у Морана I были лучшие результаты (см. P-значения под каждым графиком) .

Почему ученые не используют вместо Морана I? Есть ли какая-то скрытая причина, которую я не вижу? И если есть какая-то причина, как я могу знать (как гипотезы должны быть построены иначе), чтобы надлежащим образом использовать тест Мантеля или Морана I? Пример из реальной жизни будет полезен.

Представьте себе такую ​​ситуацию: на каждом дереве стоит фруктовый сад (17 х 17 деревьев) с вороной. Уровни «шума» для каждой вороны доступны, и вы хотите знать, определяется ли пространственное распределение ворон по шуму, который они производят.

Есть (как минимум) 5 возможностей:

  1. "Рыбак рыбака видит издалека." Чем больше похожих ворон, тем меньше географическое расстояние между ними (единое скопление) .

  2. "Рыбак рыбака видит издалека." Опять же, чем больше похожих ворон, тем меньше географическое расстояние между ними (несколько скоплений), но одна группа шумных ворон не знает о существовании второго скопления (иначе они слились бы в одно большое объединение).

  3. «Монотонный тренд».

  4. "Противоположности притягиваются." Подобные вороны не выносят друг друга.

  5. «Случайная картина». Уровень шума не оказывает существенного влияния на пространственное распределение.

Для каждого случая я создавал график точек и использовал тест Мантеля для вычисления корреляции (неудивительно, что его результаты незначительны, я бы никогда не попытался найти линейную связь среди таких моделей точек).

введите описание изображения здесь


Пример данных: (сжато, насколько это возможно)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Создание матрицы географических расстояний (для Морана I инвертировано):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Создание участка:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS В примерах на веб-сайте помощи статистики UCLA оба теста используются для одних и тех же данных и одной и той же гипотезы, что не очень полезно (см. Тест Мантеля , Морана I ).

Ответ на IM Вы пишете:

... он [Мантель] проверяет, расположены ли тихие вороны рядом с другими тихими воронами, в то время как шумные вороны имеют шумных соседей.

Я думаю, что такая гипотеза не может быть проверена тестом Мантеля . На обоих графиках гипотеза верна. Но если вы предполагаете, что одна группа нешумных ворон может не знать о существовании второй группы нешумных ворон, тест Мантелса снова бесполезен. Такое разделение должно быть очень вероятным по своей природе (в основном, когда вы делаете сбор данных в большем масштабе).

введите описание изображения здесь

Ladislav Naďo
источник

Ответы:

19

Тест Мантеля и Морана Я имею в виду два совершенно разных понятия.

Причиной использования Морана I является вопрос пространственной автокорреляции: корреляция переменной с самим собой в пространстве. Каждый использует Морана I, когда хочет знать, в какой степени возникновение события в ареальной единице делает более вероятным или маловероятным возникновение события в соседней ареальной единице. Другими словами (используя ваш пример): если на дереве есть шумная ворона, насколько вероятны или маловероятны другие шумные вороны по соседству? Нулевой гипотезой Морана I является отсутствие пространственной автокорреляции в представляющей интерес переменной.

Причиной использования теста Мантеля является вопрос сходства или различия между переменными. Один из них использует критерий Мантеля, когда хочет узнать, являются ли выборки, которые похожи с точки зрения предикторных (пространственных) переменных, также тенденцией быть похожими с точки зрения зависимой (видовой) переменной. Проще говоря: образцы, которые находятся близко друг к другу, также схожи по составу, и образцы, которые пространственно удалены друг от друга, также отличаются по составу? Используя ваш пример: он проверяет, расположены ли тихие вороны рядом с другими тихими воронами, в то время как шумные вороны имеют шумных соседей. Нулевой гипотезой является отсутствие связи между пространственным положением и DV.
Помимо этого, частичный критерий Мантеля позволяет сравнивать две переменные, в то же время проверяя третью.
Например, для сравнения необходим тест Мантеля

  • Две группы организмов, которые образуют одинаковый набор единиц выборки;
  • Структура сообщества до и после нарушения;
  • Генетическая / экологическая дистанция и географическая дистанция.

Вот хорошее обсуждение теста Мантеля и его применения.

(Отредактировано в ответ на новые примеры Ладислава Надо)

Если я могу предположить, причина вашей путаницы в том, что вы продолжаете думать о пространстве и шуме в своих примерах либо как две непрерывные переменные, либо как одна матрица расстояний (положение в пространстве) и одна непрерывная переменная (шум). Фактически, чтобы проанализировать сходство между двумя такими переменными, нужно думать о них обоих как о матрицах расстояний . То есть:

  • одна матрица (например, для пространства) описывает различия для каждой пары географических координат. Значение для двух ворон, сидящих рядом, ниже, чем для ворон, сидящих далеко друг от друга;
  • другая матрица (для экологической, генетической или любой другой структуры) описывает различия между измеренными результатами в заданных точках. Значение для 2 ворон с одинаковым уровнем шума (не имеет значения, тихие они или шумные - это всего лишь мера сходства!) Ниже, чем значение для пары ворон с разным уровнем шума.

Затем критерий Мантеля вычисляет перекрестное произведение соответствующих значений в этих двух матрицах. Позвольте мне еще раз подчеркнуть, что статистика Мантеля является корреляцией между двумя матрицами расстояний и не эквивалентна корреляции между переменными , используемыми для формирования этих матриц.

Теперь давайте возьмем две структуры, которые вы показали на рисунках A и B.
На рисунке A расстояние в каждой паре ворон соответствует сходству их уровня шума. Вороны с небольшими различиями в уровне шума (каждая тихая ворона против другой тихой вороны, каждая шумная ворона против другой шумной вороны) остаются рядом, в то время как каждая пара ворон с большой разницей в уровне шума (тихая ворона). против шумной вороны) держаться подальше друг от друга. Тест Мантеля правильно показывает, что между двумя матрицами существует пространственная корреляция.
Однако на рисунке B расстояние между воронами несоответствуют сходствам по уровню шума. В то время как все шумные вороны остаются вместе, тихие вороны могут или не могут оставаться близко. Фактически, расстояние в некоторых парах разнородных ворон (одна тихая + одна шумная) меньше, чем расстояние для некоторых пар похожих ворон (когда обе тихие).
На рисунке B нет никаких доказательств того, что если исследователь случайно подберет две одинаковые вороны, они будут соседями. Нет никаких доказательств того, что если исследователь случайно подберет две соседние (или не очень отдаленные) вороны, они будут похожи. Следовательно, первоначальное утверждение, которое On both plots the hypothesis validявляется неправильным. Структура, как на рисунке B, не показывает пространственной корреляции между двумя матрицами и, соответственно, не проходит тест Мантеля.

Конечно, в действительности существуют различные типы структур (с одним или несколькими кластерами схожих объектов или вообще без четких границ кластера). И тест Mantel идеально применим и очень полезен для тестирования того, что он тестирует. Если я могу порекомендовать еще одно хорошее прочтение, эта статья использует реальные данные и обсуждает Морана I, Гири С и тест Мантеля в довольно простых и понятных терминах.

Надеюсь, теперь все немного яснее; хотя я могу расширить это объяснение, если вы чувствуете, что чего-то еще не хватает.

Я
источник
1
спасибо за ваш ответ, но я думаю, что гипотеза, которую вы пишете (о реальной гипотезе теста Мантеля), бесполезна с реальными данными. Я добавляю свой ответ вам выше, буду очень рад, если вы ответите на него. Возможно я не прав.
Ладислав Naďo
@ Ладислав Надо Я обновил ответ. Пожалуйста, не стесняйтесь спрашивать больше объяснений, если это необходимо.
IM
Большое спасибо, когда я «переварил» статьи, которые вы рекомендовали, я наконец понял.
Ladislav Naďo
1
@LadislavNado Отлично! Рад помочь.
IM