Как всегда, это зависит от ваших целей и характера данных. Для полностью сопоставленных данных мощным инструментом является функция Рипли L, близкий родственник функции Рипли . Много программного обеспечения может вычислить это. ArcGIS может сделать это сейчас; Я не проверял. CrimeStat это делает. Так что GeoDa и R . Пример его использования, со связанными картами, появляется в
Синтон, Д.С. и В.Хубер. Картографирование польки и ее этнического наследия в США. Журнал географии Vol. 106: 41-47. 2007
Вот скриншот CrimeStat версии «L function» Ripley's K:
Синяя кривая документирует очень неслучайное распределение точек, потому что оно не лежит между красной и зеленой полосами, окружающими ноль, где должен находиться синий след для L-функции случайного распределения.
Для выборочных данных многое зависит от характера выборки. Хорошим ресурсом для этого, доступным для тех, кто имеет ограниченный (но не совсем отсутствующий) фон по математике и статистике, является учебник Стивена Томпсона по сэмплированию .
Как правило, большинство статистических сравнений могут быть проиллюстрированы графически, и все графические сравнения соответствуют или предполагают статистический аналог. Поэтому любые идеи, которые вы получаете из статистической литературы, могут предложить полезные способы сопоставления или графического сравнения двух наборов данных.
Примечание: следующее было отредактировано после комментария whuber
Возможно, вы захотите принять подход Монте-Карло. Вот простой пример. Предположим, что вы хотите определить, является ли распределение криминальных событий A статистически сходным с распределением событий B, вы можете сравнить статистику между событиями A и B с эмпирическим распределением такой меры для случайно переназначенных «маркеров».
Например, учитывая распределение A (белый) и B (синий),
вы случайным образом переназначаете метки A и B на ВСЕ точки в объединенном наборе данных. Это пример одиночной симуляции:
Вы повторяете это много раз (скажем, 999 раз), и для каждого моделирования вы вычисляете статистику (среднюю статистику ближайшего соседа в этом примере), используя случайно помеченные точки. Следующие фрагменты кода находятся в R (требуется использование библиотеки spatstat ).
Затем вы можете сравнить результаты графически (красная вертикальная линия - исходная статистика),
или численно.
Обратите внимание, что средняя статистика ближайших соседей может быть не лучшим статистическим показателем для вашей проблемы. Такая статистика, как K-функция, может быть более показательной (см. Ответ Уубера).
Вышесказанное может быть легко реализовано внутри ArcGIS с использованием Modelbuilder. В цикле случайное переназначение значений атрибутов каждой точке затем вычисляет пространственную статистику. Вы должны быть в состоянии подсчитать результаты в таблице.
источник
spatstat
пакета.Возможно, вы захотите проверить CrimeStat.
По данным сайта:
источник
Простой и быстрый подход может заключаться в создании тепловых карт и разностных карт этих двух тепловых карт. Связанный: Как построить эффективные тепловые карты?
источник
Предположим, вы просмотрели литературу по пространственной автокорреляции. В ArcGIS есть различные инструменты для создания точек и щелчков, чтобы сделать это с помощью сценариев Toolbox: Инструменты пространственной статистики -> Анализ образцов .
Вы можете работать в обратном направлении - найдите инструмент и просмотрите алгоритм, чтобы реализовать его в соответствии с вашим сценарием. Я использовал Индекс Морана некоторое время назад, исследуя пространственные отношения в появлении минералов почвы.
источник
Вы можете запустить двумерный корреляционный анализ во многих статистических программах, чтобы определить уровень статистической корреляции между двумя переменными и уровень значимости. Затем вы можете подтвердить свои статистические данные, сопоставив одну переменную с помощью схемы хлороплетов, а другую - с помощью градуированных символов. После наложения вы можете определить, какие области отображают пространственные отношения «высокий / высокий», «высокий / низкий» и «низкий / низкий». В этой презентации есть несколько хороших примеров.
Вы также можете попробовать несколько уникальных программ для геовизуализации. Мне действительно нравится CommonGIS для этого типа визуализации. Вы можете выбрать район (ваш пример), и вся полезная статистика и графики будут вам доступны сразу же. Это делает анализ многопараметрических карт довольно легким.
источник
Квадратный анализ был бы хорош для этого. Это ГИС-подход, позволяющий выделять и сравнивать пространственные структуры различных точечных слоев данных.
Схему анализа квадрата, которая количественно определяет пространственные отношения между несколькими точечными слоями данных, можно найти по адресу http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf .
источник