Моделирование пространственного тренда путем регрессии с координатами качестве предикторов

9

Я планирую включить координаты в качестве ковариат в уравнение регрессии, чтобы скорректировать пространственный тренд, который существует в данных. После этого я хочу протестировать остатки на пространственной автокорреляции в случайной вариации. У меня есть несколько вопросов:

  1. Должен ли я выполнять линейную регрессию, в которой только независимые переменные являются координатами и а затем проверять невязки на пространственной автокорреляции, или лучше включить не только координаты в качестве ковариат, но и другие переменные, а затем проверять невязки.xy

  2. Если я ожидаю иметь квадратичный тренд, а затем включить не только , но также , и , но тогда некоторые из них ( и ) будут иметь значение выше, чем Порог - следует ли исключить те переменные с более высоким значением как незначимые? Как мне тогда интерпретировать тенденцию, она больше не является квадратичной?x,yxyx2y2xyy2pp

  3. Я полагаю, что я должен рассматривать координаты и как любые другие ковариаты и проверять их наличие линейных отношений с зависимой переменной путем построения частичных остаточных графиков ... но затем, как только я преобразую их (если они покажут, что им нужно преобразование), это не будет будь такого рода тренд больше (особенно если я включаю , и для квадратичного тренда). Это может показать, что , например, нуждается в преобразовании, а нет или нет? Как мне реагировать в этих ситуациях?xyxyx2y2x2x

Спасибо.

Бека
источник

Ответы:

3

Я думаю, что вам может быть лучше подобрать линейную модель смешанных эффектов с пространственно коррелированными случайными эффектами (иногда называемыми геостатистической моделью). Предполагая, что ваши данные гауссовы, вы указываете модель в виде:

Yi=μi+Si+ϵi,

для наблюдений , где представляет ошибки iid и представляя ваши пространственные термины (где ). Среднее значение может быть функцией других ковариат (т. и т. Д.) Или может быть просто константой (лучше всего начинать с последнее для простоты).n1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μiμi=β0+β1xi1+β2xi2

Матрица корреляции для пространственных слагаемых (которая определяет, насколько коррелируемой, по вашему мнению, должно быть каждое наблюдение), может быть определена с помощью эмпирической вариограммы. Обычно корреляция между наблюдениями выбирается так, чтобы зависеть только от расстояния между ними (именно здесь ваши координаты входят в модель).R

Глава 2 Геостатистики на основе моделей Диггла и Рибейру (2000) должна дать вам более подробное введение. В пакете R geoR есть много процедур для подгонки геостатистических моделей, поэтому вы можете найти его полезным (см. Http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

Сэм Ливингстон
источник