Экспорт: копировать текст из PDF без разрывов строк

12

Есть некоторые PDF в дикой природе, где каждая строка текста кажется жестко закодированной, поэтому, когда я копирую текстовый блок, все идет с ним: разрывы строк и даже разделители "-".

Мои вопросы: как мне создать PDF в InDesign, где такого поведения не происходит.

Кто-нибудь знает больше об этом?

KSPR
источник
2
Я просто хотел бы прокомментировать, что это большая проблема во многих научных статьях, и я не нашел причины / решения этой проблемы. Надеемся на хорошие ответы!
benteh
... так что в этом может быть какая-то древняя экспортная функциональность в какой-то идиотской практике эпохи докембрия.
Бентех

Ответы:

3

Это связано с тем, что PDF-файлы можно создавать различными способами из ряда программ и онлайн-приложений. Каждый из них обрабатывает строки текста по-разному, поэтому вы никогда не сможете сказать, как текст на самом деле заключен в текст, пока не попытаетесь скопировать и вставить его из PDF обратно в InDesign.

Однако PDF-файлы, экспортируемые в InDesign , обычно сохраняют пробелы в конце каждой строки, поэтому вам не нужно беспокоиться о вставке возврата абзаца после каждой строки. Чтобы убедиться на 100%, установите Create Tagged PDFфлажок при экспорте PDF из InDesign. Лично я всегда буду отмечать этот флажок и включать его в любые предустановки, которые я использую. Подробнее об этой опции здесь .

Если вы столкнулись с плохо экспортированным PDF-файлом и вам необходимо очистить конечный абзац после каждой строки текста, самый быстрый вариант - Найти / Заменить. Введите ^pв Find whatполе и оставьте пустое место в Change toполе. Выберите один Storyили Selectionниже в зависимости от вашей ситуации, и это должно очистить ваш текст.

диалоговое окно поиска изменений

Lucian
источник
2

Один из подходящих способов - экспортировать PDF-файл в формате HTML из Acrobat Pro , откройте этот файл в веб-браузере и скопируйте его оттуда.

В отличие от экспорта в текстовом формате, HTML обычно не разбивает строки.

Насколько мне известно, вы не можете предотвратить это от InDesign, похоже, это поведение, которое исходит от программного обеспечения PDF или PDF. Вполне возможно, что любое программное обеспечение для публикации, использующее «текстовые фреймы / блоки», будет создавать такие тексты в формате PDF.

гоу-Хунта
источник
-2

Это потому, что именно так pdfs распознает текст - каждая строка фактически становится абзацем (следовательно, возвращается в конце). Обратного пути нет, его нужно изменить глобально в документах после копирования, используя опцию «Найти / Заменить» и скрытые символы.

Агнешка Шуба
источник
1
Но есть PDF-файлы, которые не имеют такого поведения. PDF, где вы можете скопировать все это без каких-либо хлопот. Мне просто интересно, как это могло быть достигнуто во время экспорта.
КСПР