Я работаю над некоторым программным обеспечением, которое должно определять местоположение в реальном мире (например, скоростные камеры) из нескольких отчетов на основе GPS . Пользователь будет управлять автомобилем при сообщении местоположения, поэтому отчеты очень неточные. Чтобы решить эту проблему, я должен сгруппировать отчеты о том же месте и вычислить среднее.
Мой вопрос о том, как кластеризовать эти отчеты . Я читал об алгоритмах ожидания-максимизации и кластеризации k-средних , но, как я понял, мне нужно заранее определить количество реальных мест.
Существуют ли другие алгоритмы, которым не нужно точное количество реальных местоположений, но вместо этого используются некоторые граничные условия (например, минимальное расстояние)?
Отчет содержит долготу , широту и точность (в метрах). Нет имени или чего-либо еще, что можно было бы использовать для идентификации дубликатов.
Еще одно препятствие может заключаться в том, что для реального местоположения будет только один отчет. Это мешает отличить выбросы от достоверных данных.
источник
Ответы:
Я нашел программное обеспечение, которое может вам помочь. Похоже, что у кого-то была та же проблема, что и у вас, и они дали ему решение на этом форуме , поэтому вам нужно будет использовать ArcGIS, но если вы ищете алгоритм, он предлагает эту статью . Я думаю, что документ достаточно подробный, чтобы быть хорошим началом для вашего алгоритма.
источник