Растворять полигоны на основе атрибутов с помощью Python (shapely, fiona)?

15

Я пытался создать функцию, которая делает в основном то же самое, что и функция QGIS "распустить". Я думал, что это будет супер легко, но, видимо, нет. Итак, из того, что я собрал, использование fiona with shapely должно быть лучшим вариантом здесь. Я только начал возиться с векторными файлами, так что этот мир довольно нов и для меня, и для python.

В этом примере я работаю с графическим шейп-файлом, созданным здесь http://tinyurl.com/odfbanu. Итак, вот некоторые фрагменты кода, которые я собрал, но не могу найти способ заставить их работать вместе

На данный момент мой лучший метод заключается в следующем: https://sgillies.net/2009/01/27/a-more-perfect-union-continued.html . Он работает нормально, и я получаю список из 52 состояний в виде геометрии Shapely. Пожалуйста, не стесняйтесь комментировать, если есть более прямой способ сделать эту часть.

from osgeo import ogr
from shapely.wkb import loads
from numpy import asarray
from shapely.ops import cascaded_union

ds = ogr.Open('counties.shp')
layer = ds.GetLayer(0)

#create a list of unique states identifier to be able
#to loop through them later
STATEFP_list = []
for i in range(0 , layer.GetFeatureCount()) :
    feature = layer.GetFeature(i)
    statefp = feature.GetField('STATEFP')
    STATEFP_list.append(statefp)

STATEFP_list = set(STATEFP_list)

#Create a list of merged polygons = states 
#to be written to file
polygons = []

#do the actual dissolving based on STATEFP
#and append polygons
for i in STATEFP_list : 
    county_to_merge = []
    layer.SetAttributeFilter("STATEFP = '%s'" %i ) 
    #I am not too sure why "while 1" but it works 
    while 1:
        f = layer.GetNextFeature()
        if f is None: break
        g = f.geometry()
        county_to_merge.append(loads(g.ExportToWkb()))

    u = cascaded_union(county_to_merge)
    polygons.append(u)

#And now I am totally stuck, I have no idea how to write 
#this list of shapely geometry into a shapefile using the
#same properties that my source.

Таким образом, на самом деле это не совсем то, что я видел, я просто хочу, чтобы один и тот же шейп-файл только с распадом страны на штаты, мне даже не нужна большая часть таблицы атрибутов, но мне любопытно посмотреть, как вы можете передать это от источника к новому созданному шейп-файлу.

Я нашел много фрагментов кода для написания с помощью fiona, но я так и не смог заставить его работать с моими данными. Пример из Как написать геометрию Shapely в shapefiles? :

from shapely.geometry import mapping, Polygon
import fiona

# Here's an example Shapely geometry
poly = Polygon([(0, 0), (0, 1), (1, 1), (0, 0)])

# Define a polygon feature geometry with one attribute
schema = {
    'geometry': 'Polygon',
    'properties': {'id': 'int'},
}

# Write a new Shapefile
with fiona.open('my_shp2.shp', 'w', 'ESRI Shapefile', schema) as c:
    ## If there are multiple geometries, put the "for" loop here
    c.write({
        'geometry': mapping(poly),
        'properties': {'id': 123},
    })

Проблема здесь в том, как сделать то же самое со списком геометрии и как воссоздать те же свойства, что и у источника.

User18981898198119
источник

Ответы:

22

Вопрос о Фионе и Шейпли, и другой ответ, использующий GeoPandas, требует также знать Панд . Кроме того, GeoPandas использует Fiona для чтения / записи шейп-файлов.

Здесь я не подвергаю сомнению полезность GeoPandas, но вы можете сделать это непосредственно с Fiona, используя стандартный модуль itertools , особенно с помощью команды groupby («В двух словах, groupby берет итератор и разбивает его на подитераторы на основе изменений в «ключе» основного итератора. Это, конечно, делается без чтения всего исходного итератора в память », itertools.groupby ).

Оригинальный шейп-файл, окрашенный полем STATEFP

введите описание изображения здесь

from shapely.geometry import shape, mapping
from shapely.ops import unary_union
import fiona
import itertools
with fiona.open('cb_2013_us_county_20m.shp') as input:
    # preserve the schema of the original shapefile, including the crs
    meta = input.meta
    with fiona.open('dissolve.shp', 'w', **meta) as output:
        # groupby clusters consecutive elements of an iterable which have the same key so you must first sort the features by the 'STATEFP' field
        e = sorted(input, key=lambda k: k['properties']['STATEFP'])
        # group by the 'STATEFP' field 
        for key, group in itertools.groupby(e, key=lambda x:x['properties']['STATEFP']):
            properties, geom = zip(*[(feature['properties'],shape(feature['geometry'])) for feature in group])
            # write the feature, computing the unary_union of the elements in the group with the properties of the first element in the group
            output.write({'geometry': mapping(unary_union(geom)), 'properties': properties[0]})

Результат

введите описание изображения здесь

ген
источник
Хороший тоже, трудно выбрать между обоими. Приятно видеть разные методы, спасибо!
User18981898198119
11

Я настоятельно рекомендую GeoPandas для работы с большим набором функций и выполнения массовых операций.

Он расширяет рамки данных Pandas и использует стройную структуру.

from geopandas import GeoSeries, GeoDataFrame

# define your directories and file names
dir_input = '/path/to/your/file/'
name_in = 'cb_2013_us_county_20m.shp'
dir_output = '/path/to/your/file/'
name_out = 'states.shp'

# create a dictionary
states = {}
# open your file with geopandas
counties = GeoDataFrame.from_file(dir_input + name_in)

for i in range(len(counties)):
    state_id = counties.at[i, 'STATEFP']
    county_geometry = counties.at[i, 'geometry']
    # if the feature's state doesn't yet exist, create it and assign a list
    if state_id not in states:
        states[state_id] = []
    # append the feature to the list of features
    states[state_id].append(county_geometry)

# create a geopandas geodataframe, with columns for state and geometry
states_dissolved = GeoDataFrame(columns=['state', 'geometry'], crs=counties.crs)

# iterate your dictionary
for state, county_list in states.items():
    # create a geoseries from the list of features
    geometry = GeoSeries(county_list)
    # use unary_union to join them, thus returning polygon or multi-polygon
    geometry = geometry.unary_union
    # set your state and geometry values
    states_dissolved.set_value(state, 'state', state)
    states_dissolved.set_value(state, 'geometry', geometry)

# save to file
states_dissolved.to_file(dir_output + name_out, driver="ESRI Shapefile")
Сонгололо
источник
Это намного элегантнее, чем мои странные вещи. Благодарность ! Есть ли способ передать систему пространственной привязки?
User18981898198119
Я отредактировал свой пост, чтобы показать, как перенести crs из исходного файла в новый файл. Это происходит на линии, где создается States_dissolved GeoDataFrame. Что касается схемы, я бы предложил создать ее вручную (то есть, используя свойство columns той же строки), которые затем записываются в свойства нового файла. т. е. когда вы создаете словарь состояний, просто добавляйте любые другие свойства и назначайте их столбцу в новом фрейме данных.
Сонгололо
0

Как дополнение к ответу @ gene , мне нужно было растворить более одного поля, поэтому он изменил его код для обработки нескольких полей. Код ниже использует operator.itemgetterдля группировки по нескольким полям:

# Modified from /gis//a/150001/2856
from shapely.geometry import shape, mapping
from shapely.ops import unary_union
import fiona
import itertools
from operator import itemgetter


def dissolve(input, output, fields):
    with fiona.open(input) as input:
        with fiona.open(output, 'w', **input.meta) as output:
            grouper = itemgetter(*fields)
            key = lambda k: grouper(k['properties'])
            for k, group in itertools.groupby(sorted(input, key=key), key):
                properties, geom = zip(*[(feature['properties'], shape(feature['geometry'])) for feature in group])
                output.write({'geometry': mapping(unary_union(geom)), 'properties': properties[0]})


if __name__ == '__main__':
    dissolve('input.shp', 'input_dissolved.shp', ["FIELD1", "FIELD2", "FIELDN"))
user2856
источник