Я создал простой документ MS Word, содержащий только это предложение:
Это небольшой документ.
Ничего больше. Затем я сохранил этот документ в формате DOCX и PDF. Вот размеры файлов:
DOCX: 12 кБ
PDF: 89 кБ
Технически это различие огромно , и оно действительно начинает меня беспокоить, когда в основном текстовые документы, размер которых в DOCX составляет десятки килобайт, начинают генерировать PDF-файлы размером в сотни килобайт . Что такого неэффективного в формате PDF? Или просто Word использует какой-то ужасный алгоритм вывода?
Кстати, настройки вывода PDF были установлены для создания наименьшего возможного файла:
microsoft-word
pdf
docx
Борек Бернард
источник
источник
Ответы:
Если вы откроете PDF в notepad ++, вы найдете:
и этот объект упоминается здесь в конце в инструкции / FontFile2:
Шрифты, используемые в документе Word, встраиваются в PDF, поэтому PDF-файл является автономным.
Я использовал эту слайд-деку, чтобы расшифровать инструкции PDF.
Если вы хотите предотвратить встраивание шрифтов в файл PDF, убедитесь, что в документе Word используется одна из 14 стандартных гарнитур, доступных в средствах просмотра PDF (исходная Википедия )
источник
Это случалось со мной много раз в Microsoft Word, когда я пытался экспортировать простую рукопись в PDF. Документ Word объемом 5–8 страниц, размером ~ 50 КБ, в конечном итоге будет представлять собой PDF-файл размером более 10 МБ, который слишком велик для того, чтобы кому-то было разумно отправить его по электронной почте.
Ответ Рене на правильном пути - проблема в том, что шрифты встраиваются в документ - но использование одной из стандартных гарнитур не обязательно решит проблему.
Все мои документы были в Times New Roman, в котором не использовалось ничего, кроме жирного и курсива. Или я так думал. Оказывается, у меня включен автоматический кернинг в шаблоне по умолчанию (по понятным причинам ). При экспорте в PDF Word фактически встраивал каждую из этих лигатур в качестве отдельного объекта шрифта в документ, раздутый до предела.
Исправление простое, вы просто должны помнить, чтобы делать это каждый раз:
Интересно, что вы можете оставить лигатуры, контекстные альтернативы и другие расширенные функции типографики включенными; они не оказывают заметного влияния на размер получаемого PDF.
Повторно экспортируйте документ в формате PDF, и его размер не превышает ста КБ. К сожалению, кернинг не соответствует требованиям, поэтому я не рекомендую печатать таким образом, но он отлично работает для отправки документа по электронной почте.
источник
Чтобы дать менее технический ответ, который может помочь, это то, что PDF-файлы используют векторы (то есть: математические уравнения) для описания всего, что вы видите. Все кривые и линии определяются математическими уравнениями, и поэтому в них обязательно будет много информации, особенно если у вас есть изображения в ваших документах.
Преимущество этого состоит в том, что вы можете теоретически увеличивать бесконечно близко, не теряя ни разрешения, ни деталей, потому что линии и кривые не имеют ширины, поэтому они могут масштабироваться с вашим увеличением.
Точно так же, как недавнее изменение шрифта Google уменьшило размер логотипа с ~ 14 КБ до ~ 300 Б, более простые шрифты, вероятно, помогут уменьшить размер вашего файла.
источник