Хорошие ресурсы по алгоритмам геокодирования

19

Знаете ли вы какие-нибудь хорошие ресурсы по алгоритмам геокодирования?

Меня особенно интересует разбор адресных запросов, в том числе сопоставление и взвешивание частей запроса, работа с ошибками и вариациями, а также подробности о физическом хранении данных (например, схемы для прямых запросов к реляционной базе данных, подходы к индексации данных и т. Д.) ,

Я изучил некоторые документы о геокодировании ArcGIS 10, но они немного касаются фактических деталей реализации. Детальная документация других высококачественных производственных реализаций также может быть полезна. Чем более технически, тем лучше. Теоретические алгоритмы работы также хороши.

Благодарю.

Петр Кребс
источник

Ответы:

14

От текста к географическим координатам: современное состояние геокодирования

Дэниел В. Голдберг, Джон П. Уилсон и Крейг А. Ноблок Аннотация: В этой статье представлен обзор современного состояния практики геокодирования посредством междисциплинарного исторического обзора существующей литературы. Мы исследуем развивающуюся концепцию геокодирования и фундаментальные компоненты процесса. Обсуждаются часто встречающиеся источники ошибок и неопределенностей, а также существующие меры, используемые для их количественной оценки. Представлено исследование распространенных ошибок и постоянных проблем в процессе геокодирования и описаны традиционные методы их преодоления.

10.1.1.119.714.pdf

PDF (стр. 34 и далее) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf

Mapperz
источник
Я полагаю, что вы ошиблись ссылкой, citeseerx.ist.psu.edu/viewdoc/…
Энди У
@thanks 10.1.1.119.714.pdf - это правильный обновленный пост - другое соглашение об именах было бы лучше.
Mapperz
6

Документ, на который ссылается Mapperz, очень хорош и содержит множество ссылок, которые, вероятно, будут интересны, но я не думаю, что они очень хорошо описывают сопоставление строк и его важность для процесса геокодирования. Они вкратце упомянули Soundex , но Soundex - не единственный вариант и даже не лучший вариант для адресов IMO. Они перечислили довольно много цитат, имеющих отношение к теме, поэтому эти статьи будут вам интересны.

В этой теме на сайте обмена Stats говорится о нечетком сопоставлении двух наборов строк, и при сопоставлении адресов применяются все те же методы. В частности, я думаю, что использование расстояний редактирования имеет больше смысла, чем Soundex, особенно с адресами, которые не имеют аналогов Soundex. Вычисление расстояния Левенштейна между двумя строками не так уж сложно, и их множество примеров, плавающих в Интернете ( вот один из них на Python).

Я только что провел последний час, пытаясь выяснить, как ESRI реализует их чувствительность к орфографии, а также различные оценки кандидатов и совпадений. Я не нашел ничего, кроме простых описаний (лучшее из тех, что я нашел в этом PDF- разделе и в разделе справочной системы 9.3 ). Так что, если кто-нибудь может указать мне на более подробную документацию, я был бы признателен, а также ОП.

Энди У
источник
3

Список рассылки GEOREFERENCING, предоставленный JISC Великобритании https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING

Мой блог (раздел геокодировки) содержит случайную публикацию о геокодировании и разрешении топонимов (его неструктурированный двоюродный брат): http://bit.ly/lQ0Sjs

Йохен Л. Лейднер
источник
Также: список рассылки OpenStreetMap GEOCODING lists.openstreetmap.org/listinfo/geocoding
Йохен Л. Лейднер