Я произвел обобщенные аддитивные модели для обезлесения. Чтобы учесть пространственную автокорреляцию, я включил широту и долготу в качестве сглаженного члена взаимодействия (т.е. s (x, y)).
Я основал это на чтении многих работ, где авторы говорят, что «для учета пространственной автокорреляции координаты точек были включены как сглаженные термины», но они никогда не объясняли, почему это на самом деле объясняет это. Это довольно сложно. Я прочитал все книги, которые я могу найти по GAM, в надежде найти ответ, но большинство (например, Обобщенные аддитивные модели, Введение в R, SN Wood) просто касаются предмета, не объясняя.
Я был бы очень признателен, если бы кто-то мог объяснить, ПОЧЕМУ включение широты и долготы объясняет пространственную автокорреляцию, и что на самом деле означает это «учет» - достаточно ли просто включить его в модель, или вам следует сравнить модель с s (x, y) и модель без? И указывает ли отклонение, объясняемое этим термином, на степень пространственной автокорреляции?
Ответы:
Основным вопросом в любой статистической модели являются предположения, лежащие в основе любой процедуры вывода. В модели, которую вы описываете, остатки считаются независимыми. Если они имеют некоторую пространственную зависимость, и это не моделируется в системной части модели, остатки из этой модели также будут демонстрировать пространственную зависимость, или, другими словами, они будут пространственно автокоррелированы. Такая зависимость могла бы сделать недействительной теорию, которая, например, выдает p-значения из тестовой статистики в GAM; Вы не можете доверять p-значениям, потому что они были вычислены с учетом независимости.
У вас есть два основных варианта обработки таких данных; i) моделировать пространственную зависимость в систематической части модели или ii) ослабить допущение независимости и оценить корреляцию между невязками.
i) это то, что пытаются сделать, включив сглаживание пространственных местоположений в модели. ii) требует оценки корреляционной матрицы невязок часто во время подбора модели с использованием процедуры, подобной обобщенным наименьшим квадратам. Насколько хорошо любой из этих подходов справится с пространственной зависимостью, будет зависеть от характера и сложности пространственной зависимости и от того, насколько легко ее можно моделировать.
Таким образом, если вы можете смоделировать пространственную зависимость между наблюдениями, то остатки, скорее всего, будут независимыми случайными величинами и, следовательно, не будут нарушать предположения какой-либо логической процедуры.
источник
«Пространственная автокорреляция» означает разные вещи для разных людей. Общая концепция, однако, заключается в том, что явление, наблюдаемое в местоположениях может определенным образом зависеть от (a) ковариат, (b) местоположения и (c) его значений в близлежащих местоположениях. (В тех случаях, когда технические определения различаются, речь идет о виде рассматриваемых данных, о том, какой «определенный путь» постулируется и что означает «близлежащий»: все это необходимо сделать количественным, чтобы продолжить.)z
Чтобы увидеть, что может происходить, давайте рассмотрим простой пример такой пространственной модели для описания топографии региона. Пусть измеренная высота в точке будет . Одна из возможных моделей заключается в том, что определенным математическим образом зависит от координат , которые я напишу в этой двумерной ситуации. Позволяя представлять (гипотетически независимые) отклонения между наблюдениями и моделью (которые, как обычно предполагаются, имеют нулевое ожидание), мы можем написатьz y(z) y z (z1,z2) ε
для линейной модели тренда . Линейный тренд (представленный коэффициентами и ) является одним из способов уловить идею о том, что близкие значения и для close to , должен стремиться быть ближе друг к другу. Мы даже можем рассчитать это, учитывая ожидаемое значение размера разницы между и , . Оказывается, математика многоβ1 β2 y(z) y(z′) z z′ y(z) y(z′) E[|y(z)−y(z′)|] проще, если мы используем немного другую меру разницы: вместо этого мы вычисляем ожидаемую квадратическую разницу:
Эта модель не содержит явной пространственной автокорреляции, поскольку в ней нет термина, напрямую связывающего с близлежащими значениями .y(z) y(z′)
Альтернативная, отличная модель игнорирует линейный тренд и предполагает только наличие автокорреляции. Одним из способов сделать это является структура отклонений . Мы можем утверждать, чтоε(z)
и, чтобы учесть наше ожидание корреляции, мы примем некоторую «ковариационную структуру» для . Чтобы это было пространственно значимым, мы примем ковариацию между и , равную поскольку имеет нулевое среднее значение, имеет тенденцию уменьшаться по мере того, как и становятся все более и более удаленными. Поскольку детали не имеют значения, давайте просто назовем эту ковариацию . Это пространственная автокорреляция.ε ε(z) ε(z′) E[ε(z)ε(z′)] ε z z′ C(z,z′) Действительно, (обычно Pearson) корреляция между и являетсяy(z) y(z′)
В этих обозначениях предыдущая ожидаемая квадратичная разница для первой моделиy
(при условии ), поскольку предполагается, что в разных местах независимы. Я написал вместо чтобы указать, что это ковариационная функция для первой модели.z≠z′ ε C1 C
Когда ковариации не сильно изменяются от одного местоположения к другому (действительно, они обычно предполагаются постоянными), это уравнение показывает, что ожидаемая квадратная разница в увеличивается квадратично с разделением между и . Фактическая сумма увеличения определяется коэффициентами тренда и .ε y z z′ β0 β1
Давайте посмотрим, каковы ожидаемые квадратные различия в для новой модели, модели 2:y
Опять же, это ведет себя правильно: поскольку мы полагали, что должен уменьшаться по мере того, как и становятся более разделенными, ожидаемая квадратная разница в «s действительно идет вверх с ростом разделения мест.C2(z,z′) z z′ y
Сравнение двух выражений для в двух моделях показывает, что в первой модели играет роль, математически идентичную роли во второй модели. (Там скрывается аддитивная константа, скрытая в разных значениях , но это не имеет значения в этом анализе.) Следовательно , в зависимости от модели, пространственная корреляция обычно представляется как некоторая комбинация тренда и обусловленной структуры корреляции случайных ошибок.( β 1 ( z 1 - z ′ 1 ) + β 2 ( z 2 - z 2 ) ′ ) 2 - 2 C 2 ( z , z ′ ) C i ( z , z )E[(y(z)−y(z′))2] (β1(z1−z′1)+β2(z2−z2)′)2 −2C2(z,z′) Ci(z,z)
Теперь у нас есть, я надеюсь, четкий ответ на вопрос: можно представить идею, лежащую в основе Закона географии Тоблера («все связано со всем остальным, но более близкие вещи связаны») по-разному. В некоторых моделях закон Тоблера адекватно представлен включением трендов (или «дрейфующих» терминов), которые являются функциями пространственных координат, таких как долгота и широта. В других закон Тоблера захватывается с помощью нетривиальной ковариационной структуры среди аддитивных случайных членов (ε ). На практике модели включают оба метода. Какой из них вы выберете, зависит от того, чего вы хотите достичь с помощью модели, и от вашего взгляда на то, как возникает пространственная автокорреляция - подразумевается ли она базовыми тенденциями или отражает изменения, которые вы хотите считать случайными. Ни один из них не всегда прав, и в любой конкретной проблеме часто возможно использовать оба вида моделей для анализа данных, понимания явления и прогнозирования его значений в других местах (интерполяция).
источник
Другие ответы хороши. Я просто хотел добавить кое-что о «учете» пространственной автокорреляции. Иногда это утверждение делается более строго по принципу «учета пространственной автокорреляции, не объясняемой ковариатами».
Это может представить обманчивую картину того, что делает пространственное сглаживание. Не похоже, что существует вероятность упорядоченной очереди в вероятности, когда сглаживание терпеливо ждет, пока ковариаты пойдут первыми, а затем сглаживание уничтожит «необъяснимые» части. На самом деле все они получают возможность объяснить данные.
Этот документ с точно названным названием представляет проблему действительно ясно, хотя с точки зрения модели CAR принципы применяются к сглаживанию GAM.
Добавление пространственно коррелированных ошибок может испортить фиксированный эффект, который вы любите
«Решение» в статье заключается в сглаживании остатков вместо сглаживания в пространстве. Это позволит вашим ковариатам объяснить, что они могут. Конечно, есть много приложений, в которых это не будет желательным решением.
источник
Пространственная корреляция - это просто то, как координаты x и y связаны с величиной результирующей поверхности в пространстве. Таким образом, автокорреляция между координатами может быть выражена в терминах функциональных отношений между соседними точками.
источник