Тест Мантеля широко используется в биологических исследованиях для изучения корреляции между пространственным распределением животных (положение в пространстве), например, с их генетическим родством, скоростью агрессии или каким-либо другим атрибутом. Множество хороших журналов используют его ( PNAS, Поведение животных, Молекулярная экология ... ).
Я изготовил некоторые паттерны, которые могут встречаться в природе, но тест Мантеля кажется совершенно бесполезным для их обнаружения. С другой стороны, у Морана I были лучшие результаты (см. P-значения под каждым графиком) .
Почему ученые не используют вместо Морана I? Есть ли какая-то скрытая причина, которую я не вижу? И если есть какая-то причина, как я могу знать (как гипотезы должны быть построены иначе), чтобы надлежащим образом использовать тест Мантеля или Морана I? Пример из реальной жизни будет полезен.
Представьте себе такую ситуацию: на каждом дереве стоит фруктовый сад (17 х 17 деревьев) с вороной. Уровни «шума» для каждой вороны доступны, и вы хотите знать, определяется ли пространственное распределение ворон по шуму, который они производят.
Есть (как минимум) 5 возможностей:
"Рыбак рыбака видит издалека." Чем больше похожих ворон, тем меньше географическое расстояние между ними (единое скопление) .
"Рыбак рыбака видит издалека." Опять же, чем больше похожих ворон, тем меньше географическое расстояние между ними (несколько скоплений), но одна группа шумных ворон не знает о существовании второго скопления (иначе они слились бы в одно большое объединение).
«Монотонный тренд».
"Противоположности притягиваются." Подобные вороны не выносят друг друга.
«Случайная картина». Уровень шума не оказывает существенного влияния на пространственное распределение.
Для каждого случая я создавал график точек и использовал тест Мантеля для вычисления корреляции (неудивительно, что его результаты незначительны, я бы никогда не попытался найти линейную связь среди таких моделей точек).
Пример данных: (сжато, насколько это возможно)
r.gen <- seq(-100,100,5)
r.val <- sample(r.gen, 289, replace=TRUE)
z10 <- rep(0, times=10)
z11 <- rep(0, times=11)
r5 <- c(5,15,25,15,5)
r71 <- c(5,20,40,50,40,20,5)
r72 <- c(15,40,60,75,60,40,15)
r73 <- c(25,50,75,100,75,50,25)
rbPal <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289,
replace=TRUE))
# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]
Создание матрицы географических расстояний (для Морана I инвертировано):
point.dists <- dist(cbind(my.data$x, my.data$y))
point.dists.inv <- 1/point.dists
point.dists.inv <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0
Создание участка:
X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))
library(ape)
for (i in 3:7) {
my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="",
ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat,
2), "\n p.value =", round(my.res$p, 3)))
my.res <- Moran.I(my.data[ ,i], point.dists.inv)
text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed,
3), "\n expected =",round(my.res$expected,3), "\n std.dev =",
round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}
par(mar=c(5,4,4,2)+0.1)
for (i in 3:7) {
plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance",
ylab="behavioural distance")
}
PS В примерах на веб-сайте помощи статистики UCLA оба теста используются для одних и тех же данных и одной и той же гипотезы, что не очень полезно (см. Тест Мантеля , Морана I ).
Ответ на IM Вы пишете:
... он [Мантель] проверяет, расположены ли тихие вороны рядом с другими тихими воронами, в то время как шумные вороны имеют шумных соседей.
Я думаю, что такая гипотеза не может быть проверена тестом Мантеля . На обоих графиках гипотеза верна. Но если вы предполагаете, что одна группа нешумных ворон может не знать о существовании второй группы нешумных ворон, тест Мантелса снова бесполезен. Такое разделение должно быть очень вероятным по своей природе (в основном, когда вы делаете сбор данных в большем масштабе).
источник