Я хочу преобразовать .pdf
файл в .odt
файл, чтобы потом можно было преобразовать его в .doc
файл. Есть ли программное обеспечение / скрипт, который может сделать это. Я попытался скопировать содержимое .pdf
файла и вставил его в liberoffice writer, форматирование не сохранилось.
Документ является конфиденциальным, поэтому я бы предпочел не использовать какой-либо онлайн-сервис для конвертации.
Любая помощь высоко ценится.
format-conversion
Анкит
источник
источник
Ответы:
Меня тоже раздражало отсутствие бесплатного конвертера PDF в ODT. Мне даже не нужно ничего сложного. Просто инструмент, который генерирует файлы ODT, которые я затем могу аннотировать в LibreOffice (например, для заполнения форм).
Я знаю, как сделать это вручную, преобразовав PDF-документ в графические файлы и затем импортировав их в LibreOffice, но это довольно быстро становится утомительным.
Итак, я наконец-то написал небольшой скрипт для оболочки, который автоматически выполняет все необходимые шаги. Вы можете найти его на https://github.com/gutschke/pdf2odt
Он может принимать любое количество файлов PDF и изображений в качестве входных данных и генерирует ODT-файл, который можно открывать и редактировать в LibreOffice. Изображения отображаются в качестве фона страницы, поэтому вы можете свободно писать над ними. Каждое изображение связано со своим собственным стилем страницы. Помните об этом при вставке разрывов страниц и при необходимости корректируйте стиль страницы.
Я тестировал скрипт на Linux и Mac. Учитывая, что для этого требуется всего лишь несколько достаточно стандартных инструментов, он должен быть достаточно переносимым.
источник
pdf2oo
несколько лет назад, но теперь он производит поврежденные файлы для LibreOffice. Этот скрипт делает это и многое другое - спасибо!Вы можете взглянуть на
PDF Utilities
(poppler-utils через Synaptic или apt-get), который включает pdftotext :Конечно, успех будет зависеть от того, как был создан файл PDF. Если вы получаете то , что вы хотите , как текстовый файл, вы можете затем сохранить , что в качестве .odt файла.
Изменить: я забыл предоставить источник цитаты. Это из вкладки описания в Synaptic для
PDF Utilities (based on Poppler).
источник
pdftohtml
должно быть лучше всего подходит для задачи, потому что HTML может нести форматирование. Затем HTML может быть преобразован в ODT или DOC.LibreOffice способен импортировать
.pdf
файлы. Просто откройте его в текущей версии LibreOffice для достижения наилучших результатов. Однако он откроет документ как чертеж, и вы сможете преобразовать его только в один из поддерживаемых форматов изображений, а не в документ Writer.Естественно, не все форматирование сохраняется, но, по крайней мере, некоторые.
источник
Если пакет poppler-utils установлен, приведенный ниже скрипт Nautilus (который будет помещен в папку ~ / .gnome2 / nautilus-scripts как исполняемый файл) поможет преобразовать PDF-файл в HTML (параметр «-i» можно удалить, чтобы включить изображения), который затем можно открыть с помощью LibreOffice Writer и сохранить как ODT, хотя успех преобразования форматирования во многом зависит от того, как создается PDF.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
источник
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Так-noframes
что не будет никакого эффекта с-c
сетом.Попробуйте Калибр. Он конвертируется в HTML, а затем в другие форматы. Он отлично справился с большим (183 страниц) файлом, который в противном случае пришлось бы печатать.
В моем случае я конвертировал его в epub, но для удовольствия просто конвертировал его в .docx, что получилось очень хорошо.
источник