Иногда я получаю файлы от моих клиентов с неправильным расширением. Например, имя есть, image.jpg
но файл на самом деле является изображением TIFF. Во многих случаях я могу уточнить это, открыв файл в текстовом редакторе, просмотрев первые несколько байтов, а затем определив, какой это тип файла.
Это работает для меня с файлами JPEG, TIFF, GIF и PDF. Однако есть еще много типов файлов.
Можно ли автоматизировать идентификацию правильного типа файла путем анализа содержащихся данных?
file
команда делает это на * nix машинах.windows
, но комментарий подразумевает: «Вы не можете сделать это в Windows, вместо этого вы должны использовать * nix». Так? Комментарий направлен "для тех, кто заинтересован". В чем? Сменить компьютер?:(
Ответы:
Вы можете использовать инструмент TrID , который имеет растущую библиотеку определений типов файлов для идентификации файлов с.
Подстановочные знаки поддерживаются, поэтому в вашем примере вы можете просто поместить все исследуемые изображения в папку, например, C: \ verifyimages - тогда вы можете использовать команду:
Это проверит все файлы в
verifyimages
папке.Существует также версия GUI, TrIDNet :
Доступна документация о том, как вы можете легко интегрировать TrID или TrIDNet в Windows Explorer и Total Commander:
проводник Виндоус
Total Commander
источник
файл
источник
file
стандартно, но на старых системах (особенно не Linux) не очень хорошо осведомлен. Для Ubuntu и т. Д. Он должен быть вполне респектабельным и даже установленным в качестве стандарта.file
для Windows. Если вам, как пользователю Windows, интересны другие команды * nix, изучите этот сайт, чтобы найти все виды драгоценных камней.file
это эксперт по файлам, созданным приложениями Windows.file
вообще, и все же вы почти решили о его эффективности.Я работал во Французской национальной библиотеке, чтобы создать систему цифрового архива, которая содержит не только оцифрованные книги, но и миллионы цифровых артефактов со всевозможными странными типами файлов. Мы использовали JHOVE для распознавания форматов файлов.
JHOVE имеет открытый исходный код, поддерживается JSTOR и библиотекой Гарвардского университета. Это довольно просто в использовании .
источник
Я использую библиотеки Oracle OutsideIn в своих программах. Не бесплатно, но они работают хорошо, особенно для изображений. Рынок говорит, что поддерживает более 500 типов файлов.
источник
Вы можете проверить тип файла с любого компьютера, включая Windows на
http://www.checkfiletype.com
источник