У меня есть 2 вопроса по анализу набора данных GPS.
1) Извлечение траекторий У меня есть огромная база данных записанных GPS-координат вида (latitude, longitude, date-time)
. Согласно значениям даты-времени последовательных записей, я пытаюсь извлечь все траектории / пути, по которым идет человек. Например; скажем от времени M
, (x,y)
пары постоянно меняются вплоть до времени N
. После того N
, как изменение в (x,y)
парах уменьшается, в этот момент я заключаю, что путь, взятый от времени M
кN
можно назвать траекторией. Это достойный подход, чтобы следовать при извлечении траекторий? Есть ли какие-нибудь известные подходы / методы / алгоритмы, которые вы можете предложить? Есть ли какие-либо структуры данных или форматы, которые вы хотели бы предложить мне для эффективного поддержания этих точек? Возможно, для каждой траектории было бы полезно выяснить скорость и ускорение?
2) Разработка траекторий После того, как у меня пройдены все траектории / пройдены пути, как я могу сравнить / сгруппировать их? Я хотел бы знать, похожи ли начальная или конечная точки, тогда как сравниваются промежуточные пути?
Как мне сравнить 2 пути / маршруты и сделать вывод, похожи они или нет. Более того; как объединить похожие пути в кластеры?
Я был бы очень признателен, если бы вы указали мне на исследование или что-то подобное по этому вопросу.
Разработка будет на Python, но приветствуются всевозможные предложения библиотек.
Точно такой же вопрос я открываю /programming/4910510/comparing-clustering-trajectories-gps-data-of-xy-points-and-mining-the-data в StackOverflow. Думаю, я получу больше ответов здесь ...
источник
Ответы:
Две статьи, которые вас, вероятно, заинтересуют, поскольку они имеют аналогичные мотивы для вашей:
Пределы предсказуемости в человеческой мобильности : Chaoming Song, Zehui Qu, Николас Блумм, Альберт-Ласло Барабаси. Science , Vol. 327, № 5968. (19 февраля 2010 г.), стр. 1018-1021.
Понимание индивидуальных моделей мобильности человека : Марта С. Гонсалес, Сезар А. Идальго, Альберт-Ласло Барабаси. Nature , Vol. 453, № 7196. (05 июня 2008 г.), с. 779-782.
Обратите внимание, что в двух исследованиях используются одни и те же данные, которые похожи на ваши, но не на уровне точности в пространстве или времени. Я не думаю, что я бы описал то, что вы хотите найти как траекторию, но я не уверен, как бы я это назвал. Почему именно вы хотите кластеризовать начальные / конечные узлы ваших «траекторий».
источник
PySAL - библиотека пространственного анализа Python может быть хорошим началом - http://code.google.com/p/pysal/
В частности, автокорреляционная секция:
http://pysal.org/1.2/users/tutorials/autocorrelation.html
Вы также можете рассмотреть возможность использования библиотек R http://cran.r-project.org/web/views/Spatial.html для анализа точечных паттернов .
Другие пакеты R:
Это также может упростить анализ, если привязать точки к существующим линейным транспортным сетям (автомобильным / железнодорожным), доступным в OSM. Затем вы можете символизировать на основе этих строк и сколько людей используют их в определенное время дня.
источник
Хотя я не могу комментировать траектории или пути ваших людей, я думаю, что вы находитесь на правильном пути с кластерным и временным подходом.
Я собрал демоверсию для Esri UC в прошлом году, работая с некоторыми людьми в Snow Leopard Conservancy, доступную по адресу: http://resources.arcgis.com/gallery/file/geoprocessing/details?entryID=1F9F376F-1422-2418 -7FBC-C359E9644702
Он рассматривает «места кормления» (скопления) снежных барсов на основе заданных критериев:
Хотя для анализа расстояний используются инструменты Esri, сценарий python внутри может помочь вам с идеей кластеризации, если вы знаете, какие точки находятся рядом друг с другом. (используется теория графов: http://en.wikipedia.org/wiki/Graph_theory )
Как упомянуто в других ответах, есть документы, чтобы определить атрибуты, которые вам понадобятся для принятия решений.
Анализ основывался в основном на концепциях: Кнопфа, К.Х., ARA Кноппа, М.Б. Уоррена и М.С. Бойса. 2009. Оценка методов телеметрии Глобальной системы определения местоположения для оценки параметров хищничества пумы. Журнал управления дикой природой73: 586-597.
источник
Для запуска любого типа кластеризации на вашем наборе траекторий вам необходимо иметь способ вычисления сходства или расстояния между парами траекторий. Существует несколько существующих методов для этого, и новые разрабатываются для особых случаев или для устранения недостатка традиционных (я лично работаю над новым для моей кандидатской диссертации). Хорошо известными алгоритмами являются следующие:
Если вы знакомы с этой областью, я настоятельно рекомендую книгу «Вычисления с пространственными траекториями» от нескольких исследователей Microsoft Asia.
источник
Это может быть полезным для вас:
Орельяна Д., Вахович М. Исследование закономерностей приостановки движения в пешеходной мобильности. Geogr Anal. 2011; 43 (3): 241-60. PubMed PMID: 22073410.
Также взгляните на этот блог:
ideasonmovement.wordpress.com/
источник