Открытие PDF в Illustrator разбивает текстовые объекты

10

Недавно мне пришлось конвертировать некоторые PDFфайлы в SVG, и сделал это, открыв PDF в Illustrator и сохранив в SVG.

Проблема заключалась в том, что когда Illustrator открывал PDF, многие (но не все) текстовые объекты будут разбиты на различные текстовые объекты. Например, слово «политика» - это не один текстовый объект, а несколько текстовых объектов: «po», «l», «icy». Там, казалось, не было никакой рифмы или причины для этого.

Как я могу предотвратить это?

itsmikem
источник

Ответы:

11

Обычно это происходит, чтобы сохранить внешний вид .

Если текст взаимодействует с другими объектами, он может быть разбит. Если шрифт, встроенный в PDF, является подмножеством, а не полным шрифтом, его можно разбить на AI, чтобы AI мог вставить недостающие символы из подмножества.

Вы мало что можете сделать, чтобы не допустить этого, кроме работы и сохранения в одной и той же версии Illustrator каждый раз. И только сохранение PDF в виде отдельного файла для вывода, а не редактирования.


Но вы можете исправить его в Illustrator, выбрав строки текста с помощью Direct Selection Tool или Selection Tool , Edit > Copy, а затем создать новую точку или область текста и Edit > Paste. Вставленный текст будет одной строкой, а не частями, которые были скопированы.

Скотт
источник
5
святые коты, я хочу +10 этот ответ только для этого решения. Иллюстратор сводит меня с ума в течение ЛЕТ.
Лорен-Клир-Моника-Ипсум
1
@ LaurenIpsum Вы видели ответ ниже этого? Еще более удивительно, правда.
Крис К
8

Если вы хотите объединить разорванный текст, сохранив как можно больше форматирования, размещения, абзацев и другой типографии существующего текста, вместо вставки во вновь созданную текстовую область в виде простого текста, вы можете попробовать John Wundes ' Удивительный сценарий Join Text Frames .

Он делает именно то, что говорит о банке: он объединяет фрагменты текста в один фрагмент текста, делая разумные суждения, основываясь на том, где они относительно друг друга:

  • Он объединяет примыкающие фрагменты текста (например, из прерывистых строк текста из PDF-файлов) в одну строку с определенным контролем того, насколько близко считается та же строка.
  • Он объединяет отдельные строки текста в один многострочный текстовый объект с текстом в правильном порядке (сверху вниз), исправляя поврежденные абзацы.
  • Затем есть возможность восстановить исходное форматирование всего объединенного текста. Это может занять некоторое время, но полезно дать вам довольно точные оценки того, сколько времени это займет, и возможность пропустить, если оно того не стоит.

Это действительно хорошо!


Обратите внимание, что он работает только с точечным текстом, а не с областным текстом (здесь хорошо, поскольку PDF-файлы почти всегда являются точечным текстом). Если по какой-либо причине вы пытаетесь объединить текст области, вы можете преобразовать его с помощью сценария Kelso Cartography 'Make point text'


Это также удобно использовать в сочетании с AjarProductions' Преобразовать в текст Область сценария (Келсо Картография также есть подобный сценарий, см ссылку выше), если вы хотите превратить сломанный текст обратно в в соответствующие текстовые поля с авто-протекающий пунктов:

  1. Выделите фрагменты неработающего текста, запустите сценарий объединения текстовых фреймов.
  2. Скопируйте и вставьте текст в текстовый редактор, который позволит вам найти / заменить символы абзаца (например, InDesign, простой текстовый редактор кодера или, может быть, что-то вроде ( шепотом ) Word ...)
  3. Найдите / замените нежелательный конец строки. Если есть много отдельных абзацев, которые вы хотите сохранить, 1) вы уверены, что лучше не использовать InDesign? 2) вы можете сделать это так:

    1. Найдите / замените два последовательных маркера абзаца на какой-нибудь текстовый заполнитель, который больше нигде в тексте не отображается (например \|\C.L.O.W.N.H.O.R.R.O.R/|/)
    2. Найти / заменить маркеры абзаца ничем или пробелами: превратить его в одну длинную строку текста с редкими всплесками \|\C.L.O.W.N.H.O.R.R.O.R/|/
    3. Найти / заменить \|\C.L.O.W.N.H.O.R.R.O.R/|/для нового символа абзаца - который помещает один абзац, где два были раньше.
  4. Скопируйте текст обратно и запустите на нем сценарий «Преобразовать в текстовую область». Теперь это одна плавная текстовая область с разрывами абзацев в нужных местах.


К сожалению, ничто не может исправить выделенный текст, кроме как помешать ему обрисовать в общих чертах, перепечатать его или доверять потенциально хитрому программному обеспечению OCR.

user56reinstatemonica8
источник
Ваш ответ фантастический. Я процитировал и повторно разместил первую часть вашего ответа на этот QA: graphicdesign.stackexchange.com/a/105785/19447
Крис К