Одним из наиболее важных аспектов базы данных, оборудованной ГИС, является то, что она предоставляет пользователю возможность быстро запрашивать все точки в некоторой произвольной географической области, которые соответствуют некоторым дополнительным критериям. (Например, «Найдите мне ближайшие 3 ресторана к этой точке на карте».)
Может ли кто-нибудь указать мне на теоретическое обсуждение алгоритмов? Я хочу узнать, как они работают.
В конечном счете, я хочу применить ту же возможность для обобщенных наборов числовых данных - большого облака точек в произвольном, n-мерном неевклидовом пространстве. Например, лицо человека можно охарактеризовать как вектор чисел: [расстояние между глазами, расстояние от глаза до рта, ширина лица, длина лица и т. Д.]. Я хочу снимать движение на тротуаре, оценивать особенности лица каждого человека, а затем иметь возможность делать запросы к данным позже, например, «учитывая лицо этого человека, найдите мне 100 самых похожих лиц».
Существует ли в настоящее время какое-либо программное обеспечение, которое предоставляет возможность поиска по этим обобщенным пространствам?
Я слышал, что Netezza реализовал несколько инновационных алгоритмов пространственной параллельной обработки. Официальный документ здесь .
Обновить
Я забыл упомянуть, что Netezza активно использует теорему Байеса . Вот коллекция видео здесь .
источник