Знаете ли вы какие-нибудь хорошие ресурсы по алгоритмам геокодирования?
Меня особенно интересует разбор адресных запросов, в том числе сопоставление и взвешивание частей запроса, работа с ошибками и вариациями, а также подробности о физическом хранении данных (например, схемы для прямых запросов к реляционной базе данных, подходы к индексации данных и т. Д.) ,
Я изучил некоторые документы о геокодировании ArcGIS 10, но они немного касаются фактических деталей реализации. Детальная документация других высококачественных производственных реализаций также может быть полезна. Чем более технически, тем лучше. Теоретические алгоритмы работы также хороши.
Благодарю.
Документ, на который ссылается Mapperz, очень хорош и содержит множество ссылок, которые, вероятно, будут интересны, но я не думаю, что они очень хорошо описывают сопоставление строк и его важность для процесса геокодирования. Они вкратце упомянули Soundex , но Soundex - не единственный вариант и даже не лучший вариант для адресов IMO. Они перечислили довольно много цитат, имеющих отношение к теме, поэтому эти статьи будут вам интересны.
В этой теме на сайте обмена Stats говорится о нечетком сопоставлении двух наборов строк, и при сопоставлении адресов применяются все те же методы. В частности, я думаю, что использование расстояний редактирования имеет больше смысла, чем Soundex, особенно с адресами, которые не имеют аналогов Soundex. Вычисление расстояния Левенштейна между двумя строками не так уж сложно, и их множество примеров, плавающих в Интернете ( вот один из них на Python).
Я только что провел последний час, пытаясь выяснить, как ESRI реализует их чувствительность к орфографии, а также различные оценки кандидатов и совпадений. Я не нашел ничего, кроме простых описаний (лучшее из тех, что я нашел в этом PDF- разделе и в разделе справочной системы 9.3 ). Так что, если кто-нибудь может указать мне на более подробную документацию, я был бы признателен, а также ОП.
источник
Университет Южной Каролины имеет службы обработки адресов и геокодирования, для которых они опубликовали некоторые технические детали. У них много хороших ссылок на их сайте.
источник
Список рассылки GEOREFERENCING, предоставленный JISC Великобритании https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING
Мой блог (раздел геокодировки) содержит случайную публикацию о геокодировании и разрешении топонимов (его неструктурированный двоюродный брат): http://bit.ly/lQ0Sjs
источник
Хороший ресурс для изучения геокодирования https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx
источник