Как сравнить две карты, чтобы определить, какая из них лучше?

10

Я пытаюсь сделать объективное сравнение двух разных карт для одного региона. В данный момент я борюсь с определением критериев, которые позволят мне провести беспристрастную оценку.

У кого-нибудь есть идеи, как это сделать или как мне подойти к проблеме?

Как видите, ни одна из карт не является превосходной, несколько пропусков на синем наборе, несколько на красном.

введите описание изображения здесь

STYP
источник
7
Вопрос очень плохо определен? Что вы подразумеваете под качеством? Есть ли предположения о полноте, точности, геометрии ...? Существует ли третий эталонный набор данных для сравнения?
Petzlux
Просто подумайте, почему бы не сравнить их с помощью аэрофотоснимков высокого разрешения? Может быть, даже конвертировать их в KML и оценить их точность в Google Earth.
Аарон
2
@Martin, вы просите метод для выделения геометрических различий двух слоев?
artwork21
1
По этой теме много литературы. Некоторые документы, с которых можно начать: underdark.wordpress.com/projects/…
underdark
1
Разве этот вопрос не имеет ничего общего с картографией или картами, а скорее с качеством данных? Возможно, вы могли бы перефразировать свой вопрос и предоставить больше контекста в отношении качества данных.
blah238

Ответы:

14

Этот ответ описывает объективный метод измерения произвольных расхождений между двумя пространственными наборами данных. Такие расхождения могут включать в себя сдвиги положения, изменения формы и особенности, присутствующие в одном наборе данных, но не в другом. Этот ответ не предоставляет никаких средств для определения того, что «лучше», потому что это зависит не только от данных, а от того, для чего эти данные будут использоваться.

Фон

Хорошая основа для большого набора таких измерений опирается на евклидово преобразование расстояний каждого набора данных. Это рассматривает каждый набор данных как представление набора точек на плоскости. Давайте назовем эти коллекции B для синих элементов и R для красных элементов.

Для любой точки х в плоскости, евклидово расстояния преобразования из множества точек вычисляет нижнюю грань расстояний между й и А . Мы можем думать , это преобразование , как создание «поверхности», высота которого при х равно кратчайшее расстояние от й до А . Таким образом , эта поверхность имеет впадины во всех точках А , где его высота равна нуль, и поднимается на 1: 1 склон от A . Ясно, что преобразование расстояния в свою очередь определяет A (или технически его метрическое замыкание , которое для наборов данных ГИС такое же, как A) как множество всех точек на высоте ноль. Таким образом, преобразование расстояния полностью захватывает всю пространственную информацию A, которую ГИС способна представить.

фигура 1

На этом рисунке показаны преобразования расстояния B (слева) и R (справа) в псевдорельефе.

Сравнение двух наборов данных

Чтобы сравнить B и R , наложите каждое на преобразование расстояния другого:

фигура 2

Значения расстояния отображаются в виде цветов, градуированных от синего (около 0) до красного.

Левая карта, например, показывает точки B и цвет их в соответствии с их расстояниями от R . Роли B и R поменялись на правой карте.

Уже это помогает глазу проводить сравнения: каждая карта показывает точки одного набора данных и, используя цвет, выделяет точки, которые находятся далеко от любой точки в другом наборе данных. Обратите внимание, что обе карты необходимы для сравнения, потому что каждая показывает точки не на другой.

На подробных картах цвет может быть трудно различим, поэтому мы можем немного размыть его для представления или визуальной оценки:

Рисунок 3

Примечание: цвета не сопоставимы между двумя картами: внутри каждой карты они масштабируются, чтобы показать полный диапазон расстояний на этой карте.

Статистический анализ различий

Прелесть этого подхода заключается в том, что можно сделать в постобработке. Используя растр для представления преобразований расстояний и их наложений, мы можем легко получить статистические данные - локальные и глобальные - для измерения расхождений. Например, мы могли бы сосредоточиться на всех расстояниях, превышающих некоторый небольшой порог, для изучения их частотного распределения:

Рисунок 4

В этой гистограмме синие столбцы обозначают синие элементы, а красные - красные. (Обратите внимание на логарифмический масштаб на горизонтальной оси.) Эта гистограмма показывает исходные наложенные данные, а не производные размытые данные. Он выбрал только те расстояния больше трех пикселей в исходном изображении.

Эти гистограммы показывают, что синие объекты гораздо чаще находятся далеко от красных объектов, чем наоборот : синие полосы выше красных и простираются на большие расстояния (справа). Весь арсенал описательной статистики теперь доступен для количественной оценки различий между двумя наборами данных. Эта статистика может быть применена ко всей интересующей области или «оконной» над ней, чтобы изучить, как эти два набора данных различаются в зависимости от местоположения.

Реализация

Большинство растровых ГИС обеспечивают евклидово дистанционное преобразование (например, EuclideanDistance в ArcGIS и r.grow.distance в GRASS), и все поддерживают простое (маскирующее) наложение, необходимое для этого анализа. Размытие, при желании, может быть выполнено с помощью среднего значения соседства или свертки ядра (которое включает в себя «размытие по Гауссу», доступное во всех программах обработки изображений). Большинство GISes этого не обеспечивает адекватную поддержку полного статистического анализа растровых данных, хотя, но они хороши при экспорте таких данных в форматах , читаемые статистическим и программно - математического обеспечение , такие как Rили Mathematica (который сделал все цифры здесь).

Whuber
источник
Как всегда, ваш ответ - увлекательное чтение, и я нахожу новые вещи для изучения и размышления. Не могли бы вы также рассказать мне, как вы создали «нарисованный от руки» тип графика?
Девдатта Тенгше
3
@Devdatta Гистограмма была создана в Mathematica путем пост-обработки с изменением кода на mathematica.stackexchange.com/questions/11350/xkcd-style-graphs . Дополнительные примеры таких графических изображений приведены по адресу stats.stackexchange.com/questions/49123/… и stats.stackexchange.com/questions/48973/… и stats.stackexchange.com/questions/48467/… .
whuber
4

Поскольку это проблема проверки геометрии, загрузите текущее изображение и посмотрите, можете ли вы проверить улицы как существующие или как существующие. Вероятно, один набор данных является более новым и / или более полным. Узнайте, какой набор данных имеет наибольшую горизонтальную точность, а какой был собран последним и каким процессом. Это разница между следами тигра, osm, gis и gps? Снимки - ваш друг, по крайней мере, точные образы, такие как HAIP недавнего урожая. Критерием может быть: полнота, охват, точность, правильность, валюта.

Льюис
источник
1

Я думаю, следуя комментариям и ответам выше (возможно, это также должен быть комментарий, а не ответ), но я бы использовал то, что у меня есть, для проверки файлов при визуальном сравнении. Выберите функции там, где имеются точные данные, представленные на графике, например, в дорожных сетях (в Англии Шотландия и Уэльс свободно доступны в ОС).

Вслед за предложением использовать Google Earth и изображения. Используйте плагин openlayers, чтобы загрузить спутниковые изображения в фон и сравнить еще раз.

Много бесплатных точных карт, которые можно использовать в качестве базы для сравнения.

Ger
источник
К сожалению, я начал проводить это сравнение, основываясь на том факте, что OSM и другие карты OpenSource на самом деле не так точны, как нам кажется. Но ввод информации об использовании спутниковых снимков - это то, что нужно сделать!
Styp