Сегодня я случайно обнаружил, что .docx - это тот же .zip (или между ними нет большой разницы). Когда вы меняете .docx на .zip и открываете с WinRAR, вы видите кучу файлов XML в папках. В этом XML-файле хранятся текст, шрифты, владелец, последние изменения и так далее. Одним словом вся информация хранится в виде XML-данных.
Но то же самое не подходит для файлов расширения .doc. Невозможно открыть их как .zip op как .rar.
Итак, вопрос: в чем преимущество хранения данных .docx в XML по сравнению с тем, что Microsoft изменила способ хранения данных? На самом деле я хочу знать не преимущество формата XML, а то, почему Microsoft использует несколько файлов XML для хранения данных .docx. Оказывается, что .docx не новый формат в корне.
xml
xml-serialization
Нарек
источник
источник
Ответы:
.docx
Файл может хранить вложенные ресурсы, как файлы изображений, а не только XML - файлы. Вместо того, чтобы кодировать вещи в base64 или что-то еще и сохранять их в файле XML или изобретать еще один двоичный формат сериализации, они решили использовать стандартный формат ZIP.Кроме того, XML - это очень подробный формат файла, содержащий множество избыточных шаблонов. Вы можете получить высокую степень сжатия для файлов XML.
Кстати, я не понимаю, как нас обмануть. Лучше изобрести новый загадочный формат файла с нуля или использовать стандартный, известный формат?
источник
Статья Википедии подытоживает довольно красиво:
«Microsoft столкнулась с растущим давлением, чтобы принять открытый формат файла, в частности, некоторые страны приняли правила, согласно которым официальные документы должны быть в открытом формате».
Редактировать: И архивирование имеет большой смысл, так как XML очень многословен и естественно сжимает очень хорошо.
источник
Использование переименованного файла .zip - довольно распространенная практика - например, файлы Quake III .pak действительно являются файлами .zip. Нет смысла изобретать свой собственный формат сжатого файла, когда уже есть очень хорошие.
источник
.jar
, Winamp.wsz
/.wal
(скины), Firefox.xpi
(XPInstaller - темы, дополнения). (tar
архивы также популярны.)Это не только Office Open XML, который использует сжатый XML. OpenDocument в Open Office делает то же самое за кулисами.
Есть несколько преимуществ, перечисленных на странице Википедии в соглашениях об открытой упаковке :
источник
Самым большим преимуществом является то, что вы можете получить ваши данные, разархивировав файл и скопировав текст из XML-файлов. Это можно сделать с помощью zip-утилиты и текстового редактора, даже если у вас нет копии Word 2007.
Это то, что делает формат более открытым, чем старые двоичные форматы.
источник