Построение предполагаемых склонов, как в вопросе, является отличной вещью. Однако вместо того, чтобы фильтровать по значимости - или в сочетании с этим - почему бы не наметить некоторую меру того, насколько хорошо каждая регрессия соответствует данным? Для этого среднеквадратическая ошибка регрессии легко интерпретируется и имеет смысл.
Например, приведенный R
ниже код генерирует временной ряд из 11 растров, выполняет регрессии и отображает результаты тремя способами: в нижнем ряду в виде отдельных сеток оцененных уклонов и среднеквадратичных ошибок; в верхнем ряду, как наложение этих сеток вместе с истинными базовыми склонами (что на практике вы никогда не будете иметь, но предоставляется компьютерным моделированием для сравнения). Наложение, поскольку оно использует цвет для одной переменной (предполагаемый наклон) и яркость для другой (MSE), нелегко интерпретировать в этом конкретном примере, но вместе с отдельными картами в нижнем ряду может быть полезно и интересно.
(Пожалуйста, игнорируйте перекрывающиеся легенды на оверлее. Обратите также внимание, что цветовая схема для карты «Истинные уклоны» не совсем такая же, как и для карт предполагаемых уклонов: случайная ошибка приводит к тому, что некоторые из предполагаемых уклонов охватывают более экстремальный диапазон, чем истинные склоны. Это общее явление, связанное с регрессией к среднему .)
Кстати, это не самый эффективный способ сделать большое количество регрессий для одного и того же набора времени: вместо этого матрица проекции может быть предварительно вычислена и применена к каждому «стеку» пикселей быстрее, чем ее пересчет для каждой регрессии. Но это не имеет значения для этой маленькой иллюстрации.
# Specify the extent in space and time.
#
n.row <- 60; n.col <- 100; n.time <- 11
#
# Generate data.
#
set.seed(17)
sd.err <- outer(1:n.row, 1:n.col, function(x,y) 5 * ((1/2 - y/n.col)^2 + (1/2 - x/n.row)^2))
e <- array(rnorm(n.row * n.col * n.time, sd=sd.err), dim=c(n.row, n.col, n.time))
beta.1 <- outer(1:n.row, 1:n.col, function(x,y) sin((x/n.row)^2 - (y/n.col)^3)*5) / n.time
beta.0 <- outer(1:n.row, 1:n.col, function(x,y) atan2(y, n.col-x))
times <- 1:n.time
y <- array(outer(as.vector(beta.1), times) + as.vector(beta.0),
dim=c(n.row, n.col, n.time)) + e
#
# Perform the regressions.
#
regress <- function(y) {
fit <- lm(y ~ times)
return(c(fit$coeff[2], summary(fit)$sigma))
}
system.time(b <- apply(y, c(1,2), regress))
#
# Plot the results.
#
library(raster)
plot.raster <- function(x, ...) plot(raster(x, xmx=n.col, ymx=n.row), ...)
par(mfrow=c(2,2))
plot.raster(b[1,,], main="Slopes with errors")
plot.raster(b[2,,], add=TRUE, alpha=.5, col=gray(255:0/256))
plot.raster(beta.1, main="True slopes")
plot.raster(b[1,,], main="Estimated slopes")
plot.raster(b[2,,], main="Mean squared errors", col=gray(255:0/256))