Параметры стандартизатора адресов

9

Итак, в ArcGIS 10 ESRI запретил «Стандартизацию адресов» в новых локаторах, я знаю, что вы все еще можете использовать локаторы 9.3.1 для этого; но я сильно подозреваю, что после версии 10.1 мы увидим это все меньше и меньше. FGDC Решения Standard налагает тяжелое значение на хороших адреса , имеющие префикс, префикс-направление, улица-Name, суффикс, значение Suffic-направление для хорошей чистой формы. И мое агентство нуждается в том же. Существуют ли другие инструменты, которые люди используют, чтобы взять структурированные адреса и разобрать их достаточно надежно, чтобы их можно было сохранить? Кто-нибудь из них бесплатный?






* Обновление: * Я сталкивался с этим на CodePlex (US Address Parser), и это дало мне действительно хорошую отправную точку. Это действительно приятно, потому что это управляемый код, который я могу использовать повсеместно, и до сих пор он имел очень высокий процент успешных попыток разбивать части, которые будут просматриваться построчно и по частям.

DEWright
источник
1
Моя установка ArcGIS v10 имеет ArcToolBox, инструменты геокодирования, стандартизировать адреса. Входные данные могут быть таблицей или классом объектов, поэтому они должны работать с данными пространственной привязки и / или необработанными адресами. Это то, что вы ищите?
Klewis
1
Да, но если у вас была длительная возможность передавать адрес в геокодер, а затем получить результат со стандартизированным ответом, вы могли бы сделать вызов уровня SOAP для одной записи за раз. Сейчас же; вам осталось создать сервис геообработки, хост которого отделен от остальной системы геокодирования. Таким образом, они сделали процесс более сложным и с существующей системой, имеющей такие проблемы; это не надежно.
DEWright

Ответы:

6

Парсинг адреса - сложный процесс, так как я уверен, что вы хорошо знаете.

Используя данные ZIP + 4 из USPS, вы можете определить, существует ли улица в данном городе / штате / почтовый индекс. Вы даже можете проверить, что основной номер (номер дома) попадает в правильный диапазон ZIP + 4. Корректировка названий городов и улиц для исправления ошибок в правописании также возможна с помощью списков правописания, а также сопоставления «звуки как». Взятие адреса и анализ его в отдельных компонентах, а затем сравнение его с базой данных известных адресов - единственный способ узнать, что анализ был выполнен правильно.

Знание того, что адрес вписывается в назначенную область, и знание того, что это реальный и результативный адрес, являются различными целями. Первое, приближение адреса, это то, что GoogleMap делает очень хорошо. Тем не менее, это только то, приближение. Googlemaps не дает вам знать, если адрес действительно доставляется, они показывают, где он будет находиться на карте, если бы он был реальным. Это очень ценно с точки зрения картирования, и они имеют разную степень точности.

Конечно, база данных USPS имеет недостатки (многие из них), но они также, безусловно, более точные и правильные, чем любая другая единая база данных адресов в США, и именно на эту степень точности (и тот факт, что она постоянно обновляется) мы опираемся.

Я также работаю на SmartyStreets и хотел добавить к разговору. Если вам нужно проверять менее 250 адресов в месяц, API бесплатный. Если ваша организация является некоммерческой группой, услуга полностью бесплатна без ограничений.

Джеффри
источник
В моем агентстве мы создаем отдельную службу для работы с частями геокодирования; где будут агрегироваться данные округа и / или города для первого уровня проверки; затем перейдите в коммерческие источники, такие как TomTom или NavTeq до Tiger. Мы взяли за основу составной геокодер ESRI и добавили дополнительные шаги или ветви, чтобы сравнить по исходному баллу с другим и получить более высокий балл из двух или трех. Наше использование баз данных AIS / AMS из USPS помогает в части «Доставка» в сочетании с данными округа.
DEWright
Спасибо, что поделился, Джеффри. Я (в ближайшее время) отредактирую ваш ответ в соответствии с правилами нашего сайта; пожалуйста, просмотрите наш FAQ для получения дополнительной информации.
whuber
1

Да, есть инструменты, бесплатно будет зависеть от того, где расположены ваши адреса. Есть много несвободных очистителей адресов, лицензированных USPS. Одним из них я использую ZP4 . Я считаю, что ввод и вывод могут быть гибкими в зависимости от того, как вы храните свои данные в настоящее время и как вы хотели бы хранить свои данные в будущем. Вы можете выбрать вывод данных для тех адресов, которые соответствуют адресам доставки в данных USPS, в 7 фрагментов. Эти фрагменты соответствуют номеру дома, предварительному направлению, названию улицы, суффиксу улицы, почтовому направлению, сокращению квартирной единицы и номеру квартиры. Это дорогостоящее решение аренды, которое я нашел.

ktreiche
источник
1
Хотя ZP4 очень дешевый (600 долларов в год), эти условия меня немного насторожили, и кажется, что вы должны быть осторожны с тем, как вы его используете.
blord-castillo
1

На самом деле я работаю в поле проверки адреса (компания под названием SmartyStreets), где мы проводим проверку почтового адреса (в США).

Вам понадобится сертифицированный CASS поставщик адресных данных. Программное обеспечение этих компаний было одобрено USPS для добавления недостающей информации по адресу и получения точных результатов. Одним из таких сервисов является LiveAddress - или, если у вас есть список адресов, есть Smartylist - который предоставит вам необходимую информацию. Оба бесплатны в некоторой степени, но довольно доступны после этого.

Я полагаю, что в ArcGIS API LiveAddress может быть реализован программно. Кроме того, список адресов можно экспортировать в электронную таблицу или CSV и загрузить в службу очистки списка.

Matt
источник
Я на самом деле не ищу исправления или сертификации Bulk-Mailing, к чему стремится CASS; больше для лучшего анализа и поиска, чтобы помочь исправить неправильные адреса. У меня уже есть базы данных USPS AIS и AMS, и сейчас я начинаю создавать логику для анализа и запроса записи из этих источников, если они не совпадают полностью. Я посмотрю на ссылки, на которые вы ссылаетесь; но я стремлюсь к созданию решения, которое можно было бы использовать для большинства распространенных в США адресов по более низкой цене. То, что USPS AIS / AMS не находит, не означает, что это неправильно.
DEWright
@ Право Вы правы. Существуют адреса, которые существуют за пределами домена USPS, но подавляющее большинство из них можно найти в базе данных USPS доставляемых адресов. У FedEx и UPS есть адреса (обычно удаленные), которые они доставляют, а USPS не доставляет. Было бы неплохо иметь авторитетный источник, объединяющий все эти адреса. Сложность в том, что USPS точно не разделяет всю свою базу данных, равно как и FedEx или UPS. По большей части это проприетарные данные. Проверка адреса - это больше, чем просто рассылка.
Джеффри
1

Я имел большой успех, используя библиотеку анализатора адресов США. Я создал инструмент Python, который использует библиотеку для создания проанализированных полей адреса. https://github.com/datamade/usaddress

ketar
источник
0

Другой вариант для адресов в США - это YAddress . Он также исправляет и проверяет адрес, прежде чем разбить его на компоненты. (Я работаю в компании, которая делает это.)

Майкл Дёмин
источник