Почему Word 2010 создает такие огромные файлы PDF?

11

Только сейчас я заметил, что мои документы Word 2010 (docx), которые занимают всего одну страницу и содержат простую векторную графику WMF и немного текста, имеют размер почти 1 МБ. Размер документа Word составляет всего 50 КБ, а размер файла PDF, созданного на принтере Bullzip PDF, примерно такого же размера. Так, что Microsoft записывает в другие 950 кБ?

Обновление: так как в последнее время я продолжаю получать ответы, которые не подходят, я хотел бы сохранить вам работу. Проблема исчезла после использования Windows 7 вместо XP (что я сделал более года назад). Кажется, что-то не поддерживается в старой системе, я подозреваю, что это какое-то подмножество шрифтов или около того. Также я не могу попробовать ваши предложения, потому что проблема больше не существует. Поэтому я не могу принять ответы на это.

ygoe
источник
Соответствует ли выход? Я собираюсь предположить, что Word будет соответствовать формату PDF ближе, чем Bullzip (лично никогда не слышал об этом).
Ramhound
1
Это стало происходить только после последних обновлений WORD2010. У меня есть WORD2010 и Acro Reader 9.5, но один компьютер не получил последние обновления WORD. Тот берет сильно загруженный файл DOCX с изображениями и преобразует его ВНИЗ с 4 МБ до 3 МБ, а другой компьютер с последними обновлениями WORD преобразует DOCX с 4 МБ до 18 МБ. Я не могу использовать такой большой файл. НЕ ОБНОВЛЯЙТЕ свои программы WORD.
1
Кажется, что Word экспортирует изображения в растровом формате с очень высоким разрешением. Увеличьте и сравните PDF-файлы, сгенерированные Word и Bullzip, и сравните качество
tumchaaditya
1
О, дорогой, это старый. Word 2010 начал создавать PDF-файлы более разумного размера после перехода с Windows XP на Windows 7. Я предполагаю, что в Windows 7 есть некоторый API для подстановки шрифтов, который Word использует в отличие от Windows XP, так что он всегда включал полный шрифт или что-то в этом роде. ,
ygoe
1
У меня была та же проблема с использованием Word 2013 в 64-разрядной версии Windows 7 Pro: у меня есть файл Word 2013 (docx) объемом 14 КБ, содержащий ТОЛЬКО текст lorem ipsum с форматированием по умолчанию, Word создает файл PDF объемом 90 КБ, когда PDFcreator создает файл PDF размером 22 КБ. И он быстро растет, тот же файл с некоторым форматированием (заголовок, заголовки 1 и 2), файл Word размером 15 КБ (без изображений) становится файлом 230 КБ с сохранением PDF в Word (с использованием максимального сжатия), но только с PDFcreator только 30 КБ. Моя проблема в том, что PDFcreator не обрабатывает ссылки.
Томас

Ответы:

2

Это все еще проблема с Word 2016. Возможно, не такая, как у OP, но она все еще здесь: начните с документа объемом 1 страница 20 КБ, сохраните как PDF, получите PDF объемом 300 КБ.

Я не могу сказать, почему Word делает это, но есть простой способ минимизировать эти PDF-файлы: установить GhostScript , а затем выполнить следующую команду:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

где% 1 - входной PDF, а% 2 - выходной PDF. Превращает эти 300 КБ PDF в 40 КБ PDF. Все еще не такой маленький, как CutePDF (который занимал около 30 КБ для одного и того же документа), но значительное улучшение.

Или просто пропустите этот шаг и распечатайте непосредственно в CutePDF.

RomanSt
источник
1
См. Комментарий Арджана к ответу Джакке.
fixer1234
Резервное копирование ответа. Вместо 670 Кб cutePDF создал файл размером 170 Кб.
szako
1

Много причин.

  1. XML Styling
  2. Изображения конвертированы в base64, который 33%больше оригинала
  3. Другие вещи, такие как шрифты и т.д ...
  4. Много вещей, которые, похоже, ничего не делают!
Никто
источник
1

Проверьте настройки параметров в Word 2010. Возможно, Word поручает встраивать один или несколько целых шрифтов в ваш документ. Это вызывает ужасное раздувание документа, особенно если вы используете шрифты Unicode. Снимите этот флажок, если он установлен, и Word будет вставлять только те символы, которые фактически используются в вашем документе.

Вы также должны знать, что * .docx - это сжатый формат файла, который необходимо распаковать, прежде чем он может быть преобразован в файл PDF, который увеличивает его размер.

Если это не работает для вас, есть несколько инструментов для оптимизации PDF, которые доступны через Adobe и Nuance.

Надеюсь это поможет.

Ælfstangard
источник
0

Мысль: Word преобразует векторную графику в растровое изображение или PNG и внедряет ее в документ с ограниченным или без сжатия. Проверьте настройки PDF и посмотрите, сможете ли вы это настроить.

Анализ: Один из способов проверить это - изменить расширение файла Word на .ZIP и убедиться в том, что делает Word!

Джошуа
источник
2
Вы не можете настроить генерацию PDF в Word. Вы можете выбрать только «нормальное» и «веб» качество, но это имеет значение только в несколько кБ. Я должен проверить преобразование вектора в пиксели, которое должно быть видно при очень высоком коэффициенте масштабирования.
ygoe
3
Странно, когда я увеличиваю масштаб документа PDF, я вижу растровый текст и графику в течение очень короткого времени. Это похоже на скриншот окна Word, включая сглаженный ClearType текст в низком разрешении. После этого содержимое заменяется векторными рисунками высокого разрешения для графики и текста. Как я могу заглянуть в документ PDF, чтобы узнать, есть ли внутри скрытое пиксельное изображение, которое можно удалить?
ygoe
Я не верю, что это тоже причина. Я заметил то же самое раздувание с документами, не содержащими изображения.
HappyNomad
@LonelyPixel: Вероятно, вашему ридеру PDF понадобится некоторое время, чтобы перерисовать содержимое при увеличении ..
tumchaaditya
0

Это потому, что форматирование документа PDF будет содержать стили (вероятно) для каждого символа. Я сделал что-то вроде этого, но в HTML, и он генерировал 20 КБ HTML-файл в виде файла 600 КБ.

Дамодар Дахал
источник
0

Используйте программное обеспечение, которое предназначено для определенной цели. Word хорош в создании текстовых документов, и поскольку многие другие программные средства добавляют эту функцию, MS не может ее упустить. Я действительно не понимаю, почему они решили потратить много времени и усилий на оптимизацию чего-то, что большинство людей даже не использует и не заботится о них. Люди, которые заботятся, не используют слово для печати PDF.

Вам следует изучить установку специального принтера PDF на вашем компьютере и использовать функцию PRINT для создания файла PDF. Существует множество бесплатных и коммерческих пакетов, которые отлично справляются со своей задачей и поддерживают сжатие файла PDF до минимума.

Спрашивать, ПОЧЕМУ именно Word создает такие огромные PDF-файлы, лучше спросить у инженеров MS на их форумах ... только они могут сказать. Здесь вы просто получите множество догадок о том, почему MS делает вещи так, как они делают.

Jakke
источник
1
Я очень предпочитаю встроенную функциональность экспорта PDF, поскольку она сохраняет кликабельные таблицы содержимого или встроенные URL-адреса и тому подобное. (Таким образом, экспорт в OpenOffice великолепен.) Некоторые программы могут хорошо работать с опциями печати PDF, если они предоставляются ОС . Как и некоторые браузеры в OS X работают без проблем со встроенной печатью PDF .
Арджан