Является ли начало имен с номерами плохим соглашением об именовании данных?

17

Моя компания использует ArcGIS и придерживается стандартов именования файлов проектов и данных, которые (по большей части) соблюдаются. Что меня всегда беспокоило в стандартах именования, так это то, что он обязывает начинать все имена проектов и файлов данных с номера проекта - восьмизначного числа . Я всегда считал, что присвоение имен ГИС-файлам, начинающимся с цифр, - это плохо, и процессы (особенно с GRIDS) не срабатывают из-за имени файла.

Я пытаюсь изменить корпоративные стандарты, чтобы отменить требование номера проекта, однако я не могу найти много документации о том, почему «числа в качестве первого символа» в имени файла - это плохо.

Кто-нибудь может указать мне правильное направление, насколько ресурсы для поддержки этого аргумента?

hgil
источник
Я покопаюсь в документации, но обычно числа в качестве первого символа в именах таблиц БД и структурах папок - плохая идея, если не совсем недопустимая (недопустимая). многие инструменты придерживаются этого также. это только что из ранее. gis.stackexchange.com/questions/3571/…
Брэд Несом,
2
@ Добро пожаловать на сайт! Поскольку вы отлично сформулировали свой вопрос, я позволил себе удалить начальный абзац, чтобы читатели могли сразу же ответить на ваш вопрос.
whuber
1
Числа в именах файлов не проблема, но вы не можете начинать имена классов пространственных объектов
Дерек Свингли

Ответы:

10

Это соглашение просто просит выявлять ошибки от плохих командных интерпретаторов . (Слишком легко спутать начальные цифры с числом.)

Успех вашего программного обеспечения во избежание таких ошибок сегодня не является гарантией того, что они не появятся в будущих выпусках. Это происходило много раз, в течение десятилетий, с программным обеспечением ГИС ESRI. Такое поведение широко освещалось и подробно документировалось. Вам не нужно заглядывать дальше, чем на собственные пользовательские форумы ESRI, которые датируются десятилетием. (Более глубокие поиски старых архивов спискового сервера вернут вас еще раньше, примерно к 1995 году.) Интересные поиски Google включают

Сайт "GRD ERROR": forums.esri.com

имя файла 8.3 сайт: forums.esri.com

Вместе они предоставят около сотни реальных примеров проблем, которые вызвали такие имена файлов и потенциально могут вызвать снова.

Whuber
источник
1
Что вы имеете в виду под плохими командными интерпретаторами?
Натанус
2
@Nathanus Каждый из интерфейсов «растрового калькулятора», когда-либо выпущенных для ArcGIS 8.x и 9.x. Другой пример: внутренний интерпретатор для механизма GRID, который был ядром всего растрового анализа во всем программном обеспечении ESRI в течение четверти века всего несколько лет назад. Также (в незначительной степени) интерпретатор Avenue в ArcView 2.x и 3.x. Все это не удается в некоторых критических местах правильно проанализировать их язык ввода.
whuber
@whuber .. Спасибо. в сочетании со справочной системой Mapperz JET, это дало мне отличные строительные блоки / примеры для надежного изменения стандартов.
hgil
Ой. Вы имели в виду соглашение, относящееся к их текущей практике, а не соглашение об именах. Я немного перепутал свои мысли.
Натанус
9

Избегайте чисел, если можете -

Науки о Земле имеет хороший пример http://library.oceanteacher.org/OTMediawiki/index.php/General_File-Naming_Convention_for_Earth_Science_Datasets#Filename_Sections_in_the_Order_They_Should_Appear

Пробелы могут сбить вас с толку - некоторые старые основанные на DOS команды для перемещения файлов прерываются, если пробел используется - разумно использовать «_» (подчеркивание) - это относится к рабочей станции ArcInfo - всего 8,3 (8 символов и формат файла) , В эти дни вы можете иметь больше - но сделайте его читабельным для доставки. избегать дат (большинство файлов имеют временную метку)

* В основном придерживайтесь этого утверждения Пример:

Правила соглашения об именах, согласно указаниям механизма Microsoft JET, который позволяет приложениям Windows, таким как ArcMap, читать различные форматы таблиц, включают следующее:

  • Имя должно начинаться с буквы, а не с цифры.
  • Имя не должно содержать пробелов.
  • Единственный допустимый специальный символ - это подчеркивание.

ArcMap

введите описание изображения здесь

Mapperz
источник
4

Любое диалоговое окно «Открыть» или «Выбрать» файла будет выполнять сортировку, предполагая, что файлы названы по буквам. Поэтому, если вы используете восьмизначный (!) Уникальный номер для каждого проекта, сортировка файлов быстро станет нелогичной. Например

1
10
2
20
3 etc. 

Кроме того, будет много инструментов ГИС, которые по-прежнему будут принимать файлы, соответствующие формату имени файла MS DOS 8.3 .

Использование имен файлов в качестве ключа к проекту в лучшем случае кажется громоздким требованием. Было бы гораздо лучше хранить все файлы в какой-то системе контроля версий в соответствующих репозиториях проекта.

geographika
источник
Я согласен. Это одна из причин, по которой я пытаюсь изменить существующий стандарт. Не только громоздко, но и в нашем случае избыточно, так как у нас есть номер проекта, включенный в другую часть общего пути к файлу.
hgil
+1 Хорошее замечание по поводу сортировки и хорошее предложение для альтернативы. (Вероятно, однако, что это соглашение заставляет появляться начальные нули, поэтому сортировка может работать в любом случае ...).
whuber
2

Похоже, что здесь нет ограничений на использование первой буквы в качестве цифры, кроме как здесь, в соглашении NPS.

Имена таблиц файлов и атрибутов
A. Конечные продукты ГИС - Покрытия, шейп-файлы и другие форматы должны соответствовать структуре имен файлов 10.3 (то есть cxxxxxxxxx.ext, где «c» - это буквенный символ, а «x» - буквенно-цифровой, для всего 13 символов и один период, отделяющий имя файла от расширения). Следующие соглашения должны использоваться для генерации имен файлов: ccccccc99c.ext
i. 4-значный префикс для кода парка (см. Таблицу 1).
II. 5-символьный код проекта, указанный в базе данных отслеживания проектов NCCN. См. Информацию о проекте отслеживания NCCN (NCCN 2005b, в разработке).
III. Отдельный символ, дифференцирующий ГИС-слои в одном проекте. Этот единственный символ называется кодом продукта проекта ГИС и поддерживается в базе данных отслеживания проекта NCCN. Это должен быть алфавитный символ, выбранный последовательно (т. Е. Начинаться с a, b, c и т. Д.), Поскольку для ГИС создаются или добавляются дополнительные слои ГИС. Например, предполагая, что для этого проекта уже существуют два других ГИС-слоя, файл экспорта ESRI Arc / Info начальных точек разреза проекта NOCA Landbird Inventory будет иметь имя файла «nocabda02c.e00».
Iv. Расширение Шейп-файл ESRI должен состоять как минимум из пяти файлов с одинаковыми именами и следующими расширениями: .shp, .shx, .dbf, .shp, shp.xml и .prj. <<

Извините за вышеприведенный абзац.
Мой опыт показывает, что, когда существует нестандартное соглашение об именах,
1. люди нарушают его из-за трудностей с присоединением.
2. люди нарушают его, чтобы придерживаться других стандартных соглашений об именах.

Дело в том, что существуют инструменты, которые не допускают имен файлов и имен полей из первых символов, и именование СУБД почти всегда следует этим же правилам.

Indiana документация
Oregon документация
Jason Birch документация
Nat Park Serv документация
общественной безопасности межведомственный документация
коды участка реки , кажется, игнорирует лучшие практики
Сан - Антонио документация
Более NPS документация

Брэд Несом
источник