Недавно мне пришлось конвертировать некоторые PDF
файлы в SVG
, и сделал это, открыв PDF в Illustrator и сохранив в SVG.
Проблема заключалась в том, что когда Illustrator открывал PDF, многие (но не все) текстовые объекты будут разбиты на различные текстовые объекты. Например, слово «политика» - это не один текстовый объект, а несколько текстовых объектов: «po», «l», «icy». Там, казалось, не было никакой рифмы или причины для этого.
Как я могу предотвратить это?
источник
Если вы хотите объединить разорванный текст, сохранив как можно больше форматирования, размещения, абзацев и другой типографии существующего текста, вместо вставки во вновь созданную текстовую область в виде простого текста, вы можете попробовать John Wundes ' Удивительный сценарий Join Text Frames .
Он делает именно то, что говорит о банке: он объединяет фрагменты текста в один фрагмент текста, делая разумные суждения, основываясь на том, где они относительно друг друга:
Это действительно хорошо!
Обратите внимание, что он работает только с точечным текстом, а не с областным текстом (здесь хорошо, поскольку PDF-файлы почти всегда являются точечным текстом). Если по какой-либо причине вы пытаетесь объединить текст области, вы можете преобразовать его с помощью сценария Kelso Cartography 'Make point text'
Это также удобно использовать в сочетании с AjarProductions' Преобразовать в текст Область сценария (Келсо Картография также есть подобный сценарий, см ссылку выше), если вы хотите превратить сломанный текст обратно в в соответствующие текстовые поля с авто-протекающий пунктов:
Найдите / замените нежелательный конец строки. Если есть много отдельных абзацев, которые вы хотите сохранить, 1) вы уверены, что лучше не использовать InDesign? 2) вы можете сделать это так:
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)\|\C.L.O.W.N.H.O.R.R.O.R/|/
\|\C.L.O.W.N.H.O.R.R.O.R/|/
для нового символа абзаца - который помещает один абзац, где два были раньше.Скопируйте текст обратно и запустите на нем сценарий «Преобразовать в текстовую область». Теперь это одна плавная текстовая область с разрывами абзацев в нужных местах.
К сожалению, ничто не может исправить выделенный текст, кроме как помешать ему обрисовать в общих чертах, перепечатать его или доверять потенциально хитрому программному обеспечению OCR.
источник