Каковы плюсы и минусы различных форматов данных (производительность, размер файла и т. Д.) При рассмотрении открытого распространения данных?
Наша организация хочет публиковать данные как открытые данные. Тем не менее, нет четкого представления о том, какие форматы данных использовать. Конечно, чем более «открыт» формат данных, тем проще его использовать.
Какие форматы данных являются наиболее «открытыми» и, следовательно, наиболее пригодными для распространения открытых данных, принимая во внимание следующие типы ?:
- растровые данные (я думаю: GeoTIFF, Erdas Imagine IMG?)
- векторные данные (я думаю: GML, CSV, ESRI Shapefile, DXF?)
- табличные данные (я думаю: CSV?)
- 3D-данные (я думаю: CityGML?)
- 3D point cans / LIDAR (я думаю: ЛАС?)
- я что-то забыл здесь?
Кроме того, если есть документация об открытых форматах данных, мне очень интересно, если вы хотели бы поделиться.
data
file-formats
Марк Вершуур
источник
источник
Ответы:
Инициатива открытых данных города Вены ( http://data.wien.gv.at ) использует Geoserver для предоставления доступа к растровым и векторным геоданным через сервисы Geoserver WMS и WFS . Это имеет много преимуществ: пользователи могут загружать данные в различных форматах для автономного использования (например, geojson, KML или сжатые шейп-файлы) или использовать сервисы в реальном времени, встраивая их в онлайн-карты или ГИС-проекты.
источник
Для табличного CSV. Excel в лучшем случае чрезмерно сложен, а в худшем полностью недоступен. Доступ недоступен, а PDF - это пощечина.
Для геопространственного использования geojson, это текст, он хорошо поддерживается и не имеет технических ограничений, которые имеет единственный другой жизнеспособный формат (шейп-файл). Кроме того, если у вас нет веских причин, это должно быть в WGS84, учитывая, что большинство пользователей будут в другом состоянии и не захотят плоскость состояний.
источник
Мне очень нравится NetCDF для непрерывных / массив данных (то есть растров). Плюсы для NetCDF:
Единственный недостаток NetCDF4, который я вижу, - это не очень хорошая поддержка в стандартных ГИС-пакетах, таких как ArcGIS и QGIS (хотя я очень хотел бы, чтобы это исправили!).
РЕДАКТИРОВАТЬ Некоторые другие пакеты, которые поддерживают NetCDF
Некоторые стандартные языки программирования, которые поддерживают NetCDF (хотя, честно говоря, все, что может читать HDF, может читать NetCDF4):
Для пользователей по математике и статистике у вас есть:
Конкретно в ГИС:
Если вы хотите быстро просмотреть файл NetCDF, я бы использовал кроссплатформенный Panoply от NASA. И если вы заинтересованы в большем, UCAR Unidata имеет список программного обеспечения .
источник
Я бы сказал:
Эти форматы легко читаются программным обеспечением с открытым исходным кодом и легко преобразуются в любой другой формат, необходимый для конкретных приложений.
Также +1 за открытие данных!
источник
Фактически этот же вопрос возник в opendata.SE: Какие форматы наиболее полезны для публикации геопространственных данных?
Так что, надеюсь, я не нарушаю никаких правил, цитируя свой собственный ответ:
Мой опыт, создание карт из нескольких правительственных наборов данных:
Для точечных данных лучше всего подходит CSV со столбцами «lat» и «lon». Очень легко работать с широким спектром инструментов, включая текстовые редакторы, электронные таблицы и т. Д. Есть два недостатка:
.vrt
сопутствующий файл.lat
иlon
столбцов не является абсолютно стандартным. Многие инструменты довольно либеральны в том, что они принимают.Для линий и полигонов, в порядке убывания предпочтения:
Честно говоря, лучший ответ, вероятно, "все из них". Сделайте всем одолжение и опубликуйте данные в CSV (если точка), GeoJSON, ZIP-архиве Shapefile и KMZ.
источник