Как я могу преобразовать файлы .epub в обычный текст?

32

Я могу просмотреть файл epub, скажем, okular, выделить весь текст и скопировать и вставить в текстовый редактор. Мне нужен метод командной строки - кто-нибудь знает такую ​​вещь?

drevicko
источник
Я бы порекомендовал Вам использовать расширение для чтения epub в Firefox вместо окуляра.
Adobe

Ответы:

41

Я не знаю, стоит ли устанавливать Caliber для вашей работы, но если он у вас есть, вы можете использовать мощный конвертер для электронных книг:

ebook-convert input.epub output.txt

Выходной формат вычитается из расширения выходного файла

Я предполагаю, что могут быть некоторые инструменты / скрипты XML (XSLT), которые могут преобразовать epub в текст, поскольку epub - это, по сути, XHTML в ZIP-архиве.

zetah
источник
1
Калибр (и это «электронная книга-конвертировать») действительно очень мощный инструмент! Благодарность!
drevicko
Если вы установили калибр на OS X, утилита командной строки можно найти здесь: /Applications/calibre.app/Contents/MacOS/ebook-convert.
funroll
Если вы используете инструмент командной строки, вам может потребоваться настроить или установить параметры для получения правильного вывода, или вы можете получить неправильную кодировку при преобразовании, например, из epub в обычный текст. При использовании интерфейса приложения настройки по умолчанию работают нормально.
lacostenycoder
6

Альтернативой является epub2txt Кевина Буна , доступный на Github .

epub2html - это простая утилита командной строки, предназначенная для извлечения текста из документов EPUB и, при необходимости, для его перетекания в соответствии с отображением текста определенного числа столбцов. Он полностью написан на ANSI-стандарте C.

Пример использования:

epub2txt input.epub > output.txt
xebeche
источник
2

Может быть, Калибр может удовлетворить ваши потребности.

См. Какие форматы калибр поддерживает преобразование в / из? для получения информации о поддерживаемых форматах.

Cmorales
источник
3
Хотя это может теоретически ответить на вопрос, было бы предпочтительным включить здесь основные части ответа и предоставить ссылку для справки.
hhlp
2

MuPDF может конвертировать из epubв htmlи txt. Чтобы установить его:

sudo apt install mupdf mupdf-tools

Чтобы использовать это:

mutool convert -o somefilename.txt somefilename.epub 

Предполагается txtвывод из -oопции.

Смотрите mutool convert документацию для получения дополнительной информации.

pierrely
источник