Linux file command

1

Я заметил, что fileкоманда Linux не возвращает никакого значения, если XML-файл имеет <?xml version="1.0" encoding="UTF-8"?>вверху. Если пролог отсутствует, file -i somefile.xmlвозвращает некоторое значение. У кого-нибудь есть идеи, почему это происходит? Я в основном заинтересован в знании кодировки файлов и нашел, file -i filename.xmlчто она несколько полезна, но есть ли что-нибудь лучше в Linux для определения кодировки и кодировки?


источник

Ответы:

2

Файл основан на сигнатуре в волшебном файле , он вполне уверен, что он смотрит только на пролог, а не сканирует части файла, чтобы упростить его.

jdehaan
источник
Это то, что мне интересно, что, возможно, он просто смотрит на пролог, который не очень полезен, потому что я могу закодировать файл в X и написать Y в прологе
1

Догадываться о кодировках - это черное искусство, которое даже в популярных браузерах не может быть абсолютно правильным. Я предлагаю вам позволить вашему синтаксическому анализатору подчиняться кодировке XML, громко ломаться, если кодировка оказывается недействительной, и что вы исправляете ошибки кодирования в источнике.

Tobu
источник