Метаданные - автоматическая сборка с использованием Python

11

У нас есть большой (более 10 000) репозиторий пространственных данных (векторы shp / gdb / tab и растры ecw / tif, а также данные las, xyz и DEM), где у некоторых есть записи метаданных в xml с использованием редактора метаданных anzlic. Я хочу проверить, имеет ли каждый набор пространственных данных связанную запись xml, и проверить проекции, пространственный экстент, источник и размер по сопоставленному пространственному файлу.

Я создал скрипт на основе arcpy для извлечения этой информации из читаемых форматов ESRI, но не уверен в том, как обращаться с файлами вкладок и, что более важно, как сравнивать его с XML-записью на основе anzlic metaeditor.

Так что если у нас есть citypoints.shp / .tab, то в качестве метаданных мы должны использовать citypoints_metadata.shp / .tab.xml - это отдельно от citypoints.shp.xml, который автоматически создается некоторыми программами.

Еще один похожий вопрос форума: поддерживаются ли метаданные ANZLIC с использованием нового подхода ArcGIS 10.x? но это не покрывает требование проверять наличие действительной записи и иметь дело с форматами .tab (другие, не относящиеся к esri) в рабочей области open source / creative commons согласно моему вопросу ( Как читать файлы MapInfo .tab в ArcPy ? ) Я также просмотрел программное обеспечение, упомянутое в поиске редактора метаданных ISO с открытым исходным кодом? но ни один из них не генерирует автоматически файл базовых метаданных и не позволяет сравнивать существующие записи с источником.

GeorgeC
источник
Если кому-то интересно, у меня теперь есть решение на основе Python qgis для этого. Рад поделиться, если кто-нибудь спросит.
GeorgeC

Ответы:

2

Посмотрите на проект NME

С его помощью вы можете иметь все метаданные, поддерживаемые GDAL, на которые есть ссылки в XML (также параметры вывода SQL), используя скрипт python gdalogr_catalogue.py с такой командой, как показано ниже

python gdalogr_catalogue.py -d /home/my_directory

После этого вам нужно адаптировать полученный XML из этой утилиты, чтобы иметь возможность сравнивать его с редактором метаданных anzlic или настраивать оригинальный скрипт для получения именно того, что вам нужно.

ThomasG77
источник
1

Вы рассматривали возможность преобразования не ESRI форматов в ESRI форматы? Я подумал, если ваш скрипт работает хорошо, почему бы не использовать Gdaltranslate для преобразования наборов растровых данных и ogr2ogr для преобразования наборов векторных данных в форматы ESRI. Хорошо, если вы не хотите создавать новые наборы данных, взгляните на gdalinfo.exe и ogrinfo.exe, так как названия показывают, что оба они создают метаданные, которые могут быть полезны для вас.

данго
источник
Не хотите создавать дополнительные данные - у нас есть более 10 тыс. Файлов вкладок для обработки.
GeorgeC