Качество геокода: Номинтим против PostGIS Геокодер против Геокодера :: США 2.0

14

Иногда мне нужно геокодировать >> 500 000 адресов США (без функций и пересечений). Я хотел бы настроить службу геокодирования локально для обработки этих массовых геокодов.

В прошлом я использовал Geocoder :: US 2.0 на основе Tiger . Первоначальный сравнительный анализ дает разумную точность в отношении адресов с геокодированием Google, особенно когда я не полагаюсь на анализатор Ruby и явно передаю элементы адреса в геокодер.

Я также много читал о геокодере PostGIS . Поскольку мои данные уже находятся в PostGIS, это звучит привлекательно, но я не настроил их локально, чтобы опробовать их.

Кроме того, кто-то рекомендовал мне попробовать Nominatim на местном уровне. Я мало что знаю об этом, за исключением того, что он не основан на Tiger (насколько я могу судить), и мне интересно, получу ли я более надежные результаты.

Мой вопрос к любому, имеющему опыт работы с вышеуказанными решениями: как сравнивается точность трех? В частности, что обеспечивает наиболее надежные геокоды для уличных адресов США? Я не слишком озабочен скоростью или сложностью настройки.

danpelota
источник

Ответы:

14

У меня не было возможности протестировать геокодеры Nominatim и Geocoder US. Однако я понимаю, что геокодер и Nominatim не могут быть запущены непосредственно в базе данных, что для меня является большим недостатком, поскольку затрудняет их использование в таких вещах, как триггеры или для пакетного обновления непосредственно в базе данных.

Геокодер PostGIS, представляющий собой чистый набор функций plpgsql PostGIS / postgresql, полностью работает в базе данных. Я ожидал бы, что результаты геокодера Geocoder US и PostGIS будут на одном уровне, и из того, что я тестировал с помощью веб-материалов, они есть. Google немного лучше, так как они используют названия мест.

Я думаю, что Nominatum, поскольку он использует данные OSM, использует данные тигра косвенно, поскольку импорт OSM для США в значительной степени поступает от TIGER с внесенными пользователями исправлениями. Я не уверен, какой сейчас год сбора винограда (год) Tiger OSM. Играя с веб-интерфейсами онлайн, он также использует преимущества географических названий и обладает интересным поворотом, заключающимся в том, что он позволяет указать уровень масштабирования геокодирования, который позволяет ускорить геокодирование, установив необходимую точность масштабирования.

Полное раскрытие - я много работал над PostGIS Geocoder и написал для него онлайн-руководство. Я скажу вам об ошибке, над которой я работаю, это то, что я думаю, что точка, которую она интерполирует, находится не на той стороне улицы. Я работаю над исправлением этого. Если вы не заботитесь о том, с какой стороны улицы (или хотя бы иногда), то это может быть проблемой для вас.

Возможно, стоит протестировать с онлайн-версиями, сравнивающими некоторые результаты адресов: например, nominatim, вы можете протестировать здесь: http://open.mapquestapi.com/nominatim/v1/search.php

Для моих случаев использования я обнаружил, что нечеткая проверка nominatum не так хороша, как у PostGIS Geocoder. Например, мой адрес улицы (почтовый адрес): 1 Devonshire Place, Boston MA. PostGIS возвращает ответ, который, насколько я помню, близок, Google возвращает ответ, но я не могу заставить Nominatim вернуть ответ. Чтобы быть справедливым, даже Бостонские записи о посылках не имеют ни малейшего представления, где это находится, и они занесены в записи о посылках как Вашингтонская улица. PostGIS может найти его, поскольку он выполняет различные уровни проверки и пересечения перекрестков и т. Д. Я проверил другие случаи, когда я намеренно вводил неправильный почтовый индекс или что-то в этом роде, и PostGIS возвращался с точным набором параметров. Гугл тоже.

LR1234567
источник
Additonal комментарий: Возможно , стоит во время тестирования с онлайн - версией сравнения некоторых результатов адреса: например nominatim вы можете проверить здесь: open.mapquestapi.com/nominatim/v1/search.php
LR1234567
Спасибо за ответ! Я сделаю несколько тестов в течение следующей недели или около того, но пока что меня впечатлил кодер PostGIS Tiger.
Данпелота
Конечно, за исключением
danpelota
tigergeocoder.com, использующий данные TIGER 2013, готовый к запуску собственного экземпляра сервера в облаке Amazon EC2 и геокоду 1 000 000+ в день. PostGIS, как вы упомянули, также загрузил Zillow Neighborhoods и возвращает коды FIPS для частей адреса. REST API похож на Google, но ваш собственный сервер, квота не требуется.
Биба
Nominatim работает быстро и имеет тенденцию быть более точным в 2019 году, предварительные данные о тиграх. Он не оценивает области, и угадывание адреса просто лучше.
Эндрю Скотт Эванс
-1

Технически вы можете объединить базы данных Tiger и OSM в один гигантский сервер и встроить их в Nominatum OSM. Тигра можно легко импортировать, и он дополняет сервер OSM.

Кто бы ни был, качество данных, которые вы будете возвращать, не будет на крыше. OSM не хватает точности для уличных адресов в США. В некоторых случаях я видел это на расстоянии 90 миль от первоначальной цели.

База данных Tiger также не является точной из-за назначенного ей алгоритма интерполяции для прогнозирования местоположения номеров улиц. В целом, они сместят фактическую цель с 300 футов до пары миль.

Я думаю, что вам нужно оценивать время и ресурсы хостинга, если вы строите собственный геокодер против коммерческого. С коммерческой вы будете получать места на крыше и не беспокоиться ни о чем. Цены на 500 тысяч долларов будут варьироваться от 600 до 800 долларов у разных поставщиков.

иван
источник
2
Как ваш ответ связан с вашей компанией? Похоже, что вы включаете подпись со ссылкой на ваш сайт под видом, в данном случае, ненужного отказа от ответственности, и поэтому я редактирую его. В любом случае, пожалуйста, не включайте ссылку в любой отказ от ответственности.
PolyGeo