Итак, в ArcGIS 10 ESRI запретил «Стандартизацию адресов» в новых локаторах, я знаю, что вы все еще можете использовать локаторы 9.3.1 для этого; но я сильно подозреваю, что после версии 10.1 мы увидим это все меньше и меньше. FGDC Решения Standard налагает тяжелое значение на хороших адреса , имеющие префикс, префикс-направление, улица-Name, суффикс, значение Suffic-направление для хорошей чистой формы. И мое агентство нуждается в том же. Существуют ли другие инструменты, которые люди используют, чтобы взять структурированные адреса и разобрать их достаточно надежно, чтобы их можно было сохранить? Кто-нибудь из них бесплатный?
* Обновление: * Я сталкивался с этим на CodePlex (US Address Parser), и это дало мне действительно хорошую отправную точку. Это действительно приятно, потому что это управляемый код, который я могу использовать повсеместно, и до сих пор он имел очень высокий процент успешных попыток разбивать части, которые будут просматриваться построчно и по частям.
источник
Ответы:
Парсинг адреса - сложный процесс, так как я уверен, что вы хорошо знаете.
Используя данные ZIP + 4 из USPS, вы можете определить, существует ли улица в данном городе / штате / почтовый индекс. Вы даже можете проверить, что основной номер (номер дома) попадает в правильный диапазон ZIP + 4. Корректировка названий городов и улиц для исправления ошибок в правописании также возможна с помощью списков правописания, а также сопоставления «звуки как». Взятие адреса и анализ его в отдельных компонентах, а затем сравнение его с базой данных известных адресов - единственный способ узнать, что анализ был выполнен правильно.
Знание того, что адрес вписывается в назначенную область, и знание того, что это реальный и результативный адрес, являются различными целями. Первое, приближение адреса, это то, что GoogleMap делает очень хорошо. Тем не менее, это только то, приближение. Googlemaps не дает вам знать, если адрес действительно доставляется, они показывают, где он будет находиться на карте, если бы он был реальным. Это очень ценно с точки зрения картирования, и они имеют разную степень точности.
Конечно, база данных USPS имеет недостатки (многие из них), но они также, безусловно, более точные и правильные, чем любая другая единая база данных адресов в США, и именно на эту степень точности (и тот факт, что она постоянно обновляется) мы опираемся.
Я также работаю на SmartyStreets и хотел добавить к разговору. Если вам нужно проверять менее 250 адресов в месяц, API бесплатный. Если ваша организация является некоммерческой группой, услуга полностью бесплатна без ограничений.
источник
Да, есть инструменты, бесплатно будет зависеть от того, где расположены ваши адреса. Есть много несвободных очистителей адресов, лицензированных USPS. Одним из них я использую ZP4 . Я считаю, что ввод и вывод могут быть гибкими в зависимости от того, как вы храните свои данные в настоящее время и как вы хотели бы хранить свои данные в будущем. Вы можете выбрать вывод данных для тех адресов, которые соответствуют адресам доставки в данных USPS, в 7 фрагментов. Эти фрагменты соответствуют номеру дома, предварительному направлению, названию улицы, суффиксу улицы, почтовому направлению, сокращению квартирной единицы и номеру квартиры. Это дорогостоящее решение аренды, которое я нашел.
источник
На самом деле я работаю в поле проверки адреса (компания под названием SmartyStreets), где мы проводим проверку почтового адреса (в США).
Вам понадобится сертифицированный CASS поставщик адресных данных. Программное обеспечение этих компаний было одобрено USPS для добавления недостающей информации по адресу и получения точных результатов. Одним из таких сервисов является LiveAddress - или, если у вас есть список адресов, есть Smartylist - который предоставит вам необходимую информацию. Оба бесплатны в некоторой степени, но довольно доступны после этого.
Я полагаю, что в ArcGIS API LiveAddress может быть реализован программно. Кроме того, список адресов можно экспортировать в электронную таблицу или CSV и загрузить в службу очистки списка.
источник
Я имел большой успех, используя библиотеку анализатора адресов США. Я создал инструмент Python, который использует библиотеку для создания проанализированных полей адреса. https://github.com/datamade/usaddress
источник
Другой вариант для адресов в США - это YAddress . Он также исправляет и проверяет адрес, прежде чем разбить его на компоненты. (Я работаю в компании, которая делает это.)
источник