Определение типа данных в загрузке таблицы ArcGIS

10

При добавлении слоев таблиц из файлов Excel ArcGIS пытается угадать типы данных :

Microsoft Excel не применяет типы полей для значений во время ввода данных, как это делают стандартные базы данных. Поэтому тип поля, указанный в Excel, не используется при определении типа поля, предоставляемого в ArcGIS. Вместо этого тип поля в ArcGIS определяется путем сканирования значений в первых восьми строках для этого поля. Если сканирование находит смешанные типы данных в одном поле, это поле будет возвращено как строковое поле, а значения будут преобразованы в строки.

Кто-нибудь знает, какие эвристические правила используются здесь?

fmark
источник
2
В прошлом, когда у меня было требование работать с данными Excel, мне часто удавалось заставить клиента согласиться использовать файлы .csv (которые обрабатываются как в arcgis, так и в excel).
Кирк Куйкендалл

Ответы:

4

Я не уверен, что это поможет с вашим конкретным вопросом, и вы, возможно, уже видели его, но посмотрите эти ссылки из блога Esri ArcGIS и справочных документов, оба под названием «Форматирование таблицы Excel для использования в ArcGIS» :

Основные моменты:

Excel workbook and worksheet names should not contain spaces.

Field names must:
   - start with a letter.
   - contain only letters, numbers, and underscores.
   - not exceed 64 characters.

ArcMap scans first eight rows to determine field type. 
If mixed types encountered field is converted to text.

Numeric fields are converted to the double data type.
ArcMap can only read the first 255 characters of a cell. 
PolyGeo
источник
2

Последние два предложения дают довольно хорошее представление об эвристике, которую они используют: сканировать только первые восемь строк для смешанных типов данных, все смешанное преобразуется в строки. Без дополнительной информации от ESRI или большого количества тестирования мы не сможем сказать больше об этом, поскольку, к сожалению, у нас нет исходного кода.

Проблема с использованием Excel для «реального анализа» заключается в том, что в основном это программа двумерного макета: типы данных не применяются, а различие между данными и их представлением четко не проводится.

SCW
источник