У меня есть большой набор данных с 36k точками, представляющими коммерческое использование земли, каждое с полем, содержащим квадратные метры. Я выполнил анализ плотности ядра для этого набора данных, создав растр, показывающий плотность коммерческих квадратных метров по всей площади метро. Мне нужно разделить этот растр на области, соответствующие локальным максимумам, которые я называю «центром». Я уже определил местонахождение центров, и теперь мне нужно сделать одну из двух вещей:
используйте инструмент кластеризации точек, такой как «разбиение по медоидам», чтобы сгруппировать точки в кластеры вокруг центров, которые я идентифицировал. Проблема этого метода заключается в том, что он требует значительных вычислительных ресурсов, и тем более, если я пытаюсь использовать матрицу различий для взвешивания точек по размеру.
каким-то образом разделить растр плотности ядра (который примерно напоминает растр рельефа местности) на отдельные «холмы» вокруг каждого центра. Но я не могу придумать какой-либо инструмент для этого.
Эта проблема мучила меня некоторое время, и я надеялся, что смогу выполнить метод кластеризации в R, но это отнимает много времени, и у меня заканчивается время. Кто-нибудь знает простой метод для разделения растров плотности на районы интенсивности или для быстрой кластеризации больших наборов данных?
Ответы:
Обсуждение после тесно связанной статьи выявило простое и эффективное решение : найти «холмы», перевернуть сетку вверх дном (отрицая ее значения) и найти водоразделы. Холмы - это раковины, а границы водоразделов разделяют сетку на эти раковины.
источник
Простейшим ответом было бы использование порога для маскировки областей, которые падают ниже порога. Это должно дать вам четкие области вокруг ваших центров. Тогда он сможет преобразовать эти области в формы.
Вы также можете найти инструменты пространственной статистики: кластерный анализ на растровых данных полезное обсуждение аналогичной проблемы.
источник
Я думаю, что вы должны вернуться к своей первоначальной проблеме: найти кластеры коммерческих квадратных метров во всем регионе метро.
Я предполагаю, что ваши точки - центроиды посылок со значениями коммерческой площади? Я полагаю, у вас также может быть многоугольный слой участков с общей площадью в квадратных футах для каждого участка? Это дает вам набор случаев (центроиды) и совокупность (полигоны участков) для коммерческой площади и квадратных метров соответственно.
Зайдите в SatScan http://www.satscan.org/ и запустите космическую модель, распределенную по Пуассону, и вы получите ваши коммерческие квадратные кластеры в довольно быстром порядке. (Вы также можете использовать квадратные метры земли в качестве своего населения, а не квадратные метры площади застройки. Это может быть даже лучше населения.)
источник