Выбор файловой базы геоданных (* .gdb), персональной базы геоданных (* .mdb) или шейп-файла?

43

Раньше я использовал базы геоданных как простой способ хранить все файлы вместе, а не иметь десятки шейп-файлов повсюду, и это проще, когда наконец-то экспортируются все соответствующие данные клиенту.

Почему я должен использовать базу геоданных вместо шейп-файлов при анализе и запуске функций для моих данных?

Мой основной фокус в ArcGIS, я обычно не редактирую вне этой среды.

Этот вопрос связан с тем, как Персональная база геоданных работает с точки зрения Microsoft Access?

Martin
источник

Ответы:

58

На высоком уровне может быть предпочтительнее сделать выбор, основываясь на том, неопытны ли пользователи и не нуждаются ли они только в точках, линиях и многоугольниках. Шейп-файлы могут быть подходящими для этого.

Если они нуждаются в аннотации, доменах для списков выбора и проверки, растре, более длинных именах полей и т. Д., Тогда можно использовать файловые базы геоданных, которые просты в использовании, быстры и могут быть огромными по размеру.

Персональные базы геоданных основаны на MS Access. Если не требуется, чтобы пользователи Access также взаимодействовали с ними, этот выбор был бы более ограниченным. Ограничение размера 2 Гб и невозможность хранения растров ограничены.

PolyGeo
источник
22

Я стараюсь избегать использования шейп-файлов, поскольку вы не можете хранить домены, отношения, псевдонимы и т. Д., Но они являются наиболее переносимым форматом при распространении данных среди других людей, которые используют различные системы / инструменты ГИС.

В то время как файловые базы геоданных дают лучшую производительность и способны хранить огромные наборы данных, каждый из вышеперечисленных дает плохую личную базу геоданных. Я использую их для хранения своего анализа, так как вы можете использовать ODBC для извлечения данных атрибутов прямо из них в предпочитаемое вами статистическое приложение. Если ваши данные находятся в файловой базе геоданных, вам придется возиться с их преобразованием в какой-то промежуточный формат, прежде чем вы сможете использовать их, поскольку ничто другое не сможет прочитать из файловой базы геоданных (если вы не хотите тратить время и силы на программирование API ...) ,

Поэтому для проектов я использую оба формата: файловую базу геоданных для больших статических наборов данных, персональные базы геоданных для выходных данных и анализа (если выходные данные невелики, они попадают в файловую базу геоданных).

Если вы работаете над проектом, в котором есть небольшие наборы данных, и все благополучно расположено в личной базе геоданных, то это всего лишь 1 файл для архивирования и отправки по электронной почте. Что-то рассмотреть?

Hornbydd
источник
13

Файловые базы геоданных (FGDB):

  • FGDB может содержать наборы классов объектов, которые помогают в управлении системой координат и целостности данных с помощью правил топологии. Вы сами по себе с шейп-файлами.
  • Размер FC может быть до 256 ТБ с использованием ключевых слов конфигурации. Все файлы компонентов шейп-файла ограничены 2 ГБ каждый ( источник и технический документ ).
  • Производительность FC намного быстрее, чем шейп-файл, особенно в операциях с атрибутами.
  • Векторные данные могут использоваться в сжатом формате только для чтения, что может значительно уменьшить размер файла.
  • ФК используются в пакетах карт, которые являются удобным способом обмена данными.

Персональные базы геоданных (PGDB):

  • Часто используется в качестве менеджера таблицы атрибутов (через Microsoft Access).
  • Пользователям нравится обработка строк для текстовых атрибутов.

Шейп:

  • Кроссплатформенность с большим удобством использования (например, QGIS, ArcGIS) и для геопространственных операций в среде сценариев, отличных от ESRI (например, чистый Python, R, Matlab).
  • Многие конечные пользователи будут раздражены, если вы отправите им FGDB, а не заархивированную папку, содержащую шейп-файлы. В качестве примечания, файлы KML часто используются поверх файлов SHP или FGDB для обмена простыми пространственными данными.
  • Шейп-файлы легче синхронизировать с облаком, используя такой сервис, как Google Drive, в то время как FC и FGDB часто имеют ошибки синхронизации.
Аарон
источник
9

Большинство людей рекомендуют хранить ваши данные в базе данных по соображениям производительности, то есть для быстрого запроса и поиска. Тем не менее, я полагаю, что при наличии данных в базе данных есть и преимущество валюты. Например, если вы передадите шейп-файл коллеге, он, вероятно, будет использовать его в течение неопределенного времени, но данные могли быть обновлены. Если данные хранятся в базе данных, а пользователь подключается к этой базе данных с помощью ArcGIS, они всегда будут видеть самые актуальные и актуальные данные.

Итак, основными доводами "за" базы данных являются индексирование запросов производительности (хотя вы можете индексировать в FileGDB и MDB или даже иметь индекс шейп-файла, однако я обнаружил, что вы можете дать базе данных больше оперативной памяти при индексации, поэтому я записал это как профессионал). в базу данных) Пространственные функции работают быстрее в базе данных Если у вас есть текст или адреса, вы можете иметь полнотекстовый поиск

Недостатки Знания - влияет как на проприетарный, так и на выделенный сервер с открытым исходным кодом в производственных затратах.

FileGDB / MDB Pros Portable Plug and Play (почти такой же простой, как шейп-файлы) Может быть сжат для уменьшения размера

Минусы Может потребоваться много времени для создания (мой личный опыт) для большого количества данных ESRI Restricted (ish) Параллельные пользователи Ограничения файлов

MDB - это база геоданных с поддержкой доступа Microsoft, которая имеет ограничение на размер файла 2 ГБ, поэтому, если у вас больше данных или вы хотите предоставить больше доступа для других целей, используйте FileGDB.

Больше различий можно увидеть здесь http://webhelp.esri.com/arcgisdesktop/9.2/index.cfm?TopicName=Types_of_geodatabases

Надеюсь, что это дает вам некоторое представление

tjmgis
источник
6

Я обычно использую FGDB, но это действительно зависит от того, что вам нужно хранить. Как и в других сообщениях, личные GDB устарели и имеют проблемы с размером.

Использование базы геоданных позволяет вам установить топологию, которую вы не можете сделать с простыми шейп-файлами.

Шейп-файлы содержат точные координаты фигур. В GDB местоположения привязываются к ближайшей точке сетки. Я не сталкивался с проблемами с этим, это может вызвать небольшие изменения в данных. Кроме того, к шейп-файлам проще получить доступ с помощью инструментов сторонних производителей. ESRI имеет API для FGDB, но он новый по сравнению с существующими способами взаимодействия с шейп-файлами.

Дэн
источник
4

если вы хотите использовать полноценную базу геоданных (домены с кодированными значениями, классы отношений, топологии, геометрические сети и т. д., бла-бла, без сложности или затрат на администрирование реляционной базы геоданных, И / ИЛИ вам нужна самая быстрая производительность рисования, курсора и геообработки, Файловая база геоданных - это путь. Доступ к локальному диску намного быстрее, чем к удаленной реляционной базе геоданных. FGDB, как и шейп-файлы, использует координаты с плавающей запятой, а не целые, к лучшему и худшему. FGDB могут быть хрупкими, сложными, двоичными и проприетарными. , поэтому сохраняйте большое количество резервных копий. Шейп-файлы являются самыми тупыми, но наиболее широко поддерживаемыми, и с ними можно работать довольно быстро. Реляционные базы геоданных позволяют вам использовать SQL, включая пространственный SQL, который может быть достаточно гибким и удобным для ad-hoc анализ или приложения. Личный GDB hasn 'С появлением FGDB стоило ссориться - глючные, медленные, ограничения размера файла.

MC5
источник
4

Другое преимущество fgdb перед шейп-файлами заключается в том, что объекты в fgdb могут иметь истинные кривые. В шейп-файлах кривые состоят из сколь угодно небольших отрезков прямых. Я не уверен насчет личных gdbs.

recurvata
источник