Расчет пространственной корреляции между объектами из двух отдельных слоев в QGIS

10

Я пытаюсь определить, насколько пространственно коррелирует присутствие большого числа военнослужащих действующего военного контингента в районе с более высокими / низкими уровнями насильственных преступлений. То есть, являются ли районы, окружающие крупные военные базы, в среднем более / менее жестокими, чем районы, которые не расположены вблизи военных баз?

Я работаю со следующими двумя наборами данных:

(1) набор точечных данных военных баз в континентальной части США и их соответствующих уровней войск:

Расположение военных объектов США в нижней части 48

(2) набор общенациональных данных о показателях насильственных преступлений по городам:

Уровни насильственных преступлений в США по городам

Я чувствую, что ищу какую-то гравитационную модель, в которой функция «масса» дает уровни войск на каждой базе. Таким образом, присутствие большого количества войск будет оказывать влияние на большую территорию и будет оказывать более сильное влияние вблизи центра масс (то есть расположения точек в слое ГИС).

Я думаю, что концептуально это будет выглядеть примерно так: гравитационная модель - диаграмма затухания расстояния

На этой диаграмме X, Y, Z обозначают военные базы. a, b, c, d каждый представляет города (каждый из которых имеет поле уровня насилия в своей таблице атрибутов).

Градиент вокруг оснований представляет собой поле влияния, которое экспоненциально уменьшается с расстоянием от базового центроида. Большее присутствие войск означает больший радиус влияния (с некоторым максимальным пороговым расстоянием), а также более сильное влияние рядом с центром относительно областей рядом с меньшей базой.

Каждому городу будет присвоен балл, основанный на суммировании величины всех векторов «силы» от всех окружающих баз, радиус влияния которых они лежат. Так, например, на моей диаграмме, Город a будет иметь оценку 0, поскольку он лежит вне радиуса любой базы. Город б будет зависеть только от базовой X . Город с будет зависеть только от базы Z , и его оценка будет ниже , чем б , так как X является гораздо большим основанием , чем Z . Наконец, Город d находится в радиусе обеих баз X и Y, он получил бы оценку, основанную на суммировании величины влияния от обеих баз. Тогда я бы увидел, есть ли корреляция между более высоким баллом по городу и более высоким уровнем насилия.

Я изучал различные гравитационные модели (модели Хаффа и т. Д.), Но так и не смог найти что-то такое же, как QGIS / Python, и не совсем уверен, как реализовать то, что я описал выше ... У кого-нибудь есть предложения? за это? Кто-нибудь из вас ранее проводил такой анализ в других областях?

Итак, TLDR это:

  • Какие статистические методы я могу использовать для такого рода вопросов?
  • Существуют ли какие-либо инструменты, встроенные в QGIS (или доступные в виде плагинов), которые могут это сделать?
  • Если в QGIS нет ничего подобного, существуют ли библиотеки Python, которые могут выполнять такой анализ?
Дж. Тейлор
источник
Просто чтобы быть ясно, я знаю , что есть тонны других факторов , которые вступают в игру со ставками насилия (бедность, городской плотности и т.д.) , но , пожалуйста , предполагающих для простоты , что не было никаких существенных переменных искажающие и что я только глядя на корреляцию между этими двумя переменными (уровень войск и уровень насилия). На данный момент это всего лишь учебное упражнение, и я пытаюсь выяснить, какие инструменты мне доступны. Спасибо!
Дж. Тейлор
1
Чтобы ответить на ваш третий вопрос, я нашел PySAl, который был разработан профессором Люком Анселином, который стоит посмотреть, учитывая ваши интересы. Он также работал над GeoDa, который является готовым решением для того, что вы смотрите. Может быть плагин PySAl для QGIS? pysal.readthedocs.org/en/latest
Рафаил

Ответы:

2

Расширяя мой комментарий выше

То, что вы, вероятно, в конечном итоге захотите сделать, - это запустить линейную регрессию с пространственным запаздыванием, которая учитывает пространственную корреляцию некоторых ваших переменных (я собираюсь посмотреть на мои заметки по этому вопросу).

Люк Анселин был пионером в этой области, и вы должны взглянуть на его работу, особенно на (бесплатные) инструменты и документацию в Центре GeoDa . Оба эти инструмента могут быть вам интересны:

  1. GeoDa, автономное программное обеспечение для исследования пространственной (авто) корреляции.
  2. PySAL , библиотека пространственной аналитики Python.

Мой поиск плагина PySAL для QGIS обнаружил что-то, что не обновлялось годами, но вам, возможно, повезет больше.

Рафаэль
источник
Спасибо, Рафаэль. Я буду больше изучать концепцию «линейной регрессии с пространственным запаздыванием». Я уже сталкивался с PySAL / GeoDa благодаря рекомендации по каналу #qgis IRC. Вы правы, что большая часть документации на странице GeoDa была полезна. Я до сих пор не нашел ничего, что делало бы именно то, что я хочу, но если мне в конечном итоге придется самому кодировать его, то там будет много инструментов, которые выглядят так, будто они будут полезными «строительными блоками».
Дж. Тейлор