Я хотел бы отсканировать большое количество бумаг, которые у меня лежат, с наименьшими трудностями. Я хотел бы преобразовать их в изображения с помощью Simple Scan, а затем преобразовать их в текст с помощью OCR. Есть ли хорошее приложение для распознавания текста с графическим интерфейсом, которое даст мне хорошие результаты одним нажатием кнопки?
78
Ответы:
GOCR from - это программа оптического распознавания символов. Она преобразует отсканированные изображения текста обратно в текстовые файлы.
CLARA - еще один хороший графический вариант.
OCRAD from OCR может использоваться как автономное консольное приложение или как бэкэнд для других программ.
KOOKA from является приложением KDE, но работает нормально, кроме того, вам необходимо установить настоящие программы OCR, такие как GOCR и OCRAD. После установки Kooka и программ OCR вы должны указать Kooka на место установки OCR, чтобы он мог преобразовать JPEG в текст.
OCRFeeder от - это система анализа документов и система оптического распознавания символов.
Тессеракт из утилита командной строкии это очень просто use.You может установить языковой пакет Тессеракт-OCr-Инг из здесь .
Посмотрите на эту страницу .
Примечание:
чтобы запустить tesseract goto терминал и введите следующее
Tesseract может только читать файл TIFF - если у вас есть JPEG или PDF или что-то еще, вам придется конвертировать его. Кроме того, расширение файла должно быть .tif, а не .tiff, в противном случае выведите ошибки.
источник
tesseract
версия Ubuntu (3.04.00 в Ubuntu 15.10) не имеет проблем сPNG
входными файлами. он принимаетJPG
файлы, но дает для них худший результат, как и следовало ожидать от дополнительных артефактов сжатия.Есть несколько популярных инструментов командной строки OCR, которые вы можете использовать (я не уверен, что они имеют графический интерфейс):
Тессеракт ( ReadMe , FAQ ) (Python)
Также доступно для: Tesseract .NET , Tesseract iOS
Использование:
GOCR
OCRopus ™ ( FAQ ) (написано на Python, NumPy и SciPy)
Tessnet2 (с открытым исходным кодом, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Несколько других: ABBYY CLI OCR для Linux , Asprise OCR
Для более полного списка, проверьте: Список программного обеспечения для оптического распознавания символов в Википедии
Смотрите также:
wanghaisheng/awesome-ocr
- Кураторский список перспективных ресурсов OCR на GitHub.источник
линукс-интеллигентный OCR-решение
отказ от ответственности - я тесно связан с разработкой этого решения с открытым исходным кодом
Лиос может конвертировать печать в текст с помощью сканера или камеры.
Он также может создавать текст из отсканированных изображений из других источников, таких как Pdf, изображение или папка, содержащая изображения.
Программе предоставляется полная доступность для слабовидящих.
Так как я тесно связан - мне бы очень понравилась обратная связь.
источник
gscan2pdf
OCR на многостраничных PDF или отсканированных документах
Это, наверное, самый простой способ. Gscan2pdf - это графический инструмент, который позволяет не только сканировать файлы, но и импортировать файлы и выполнять распознавание по ним. Установите gscan2pdf отсюда , из Ubuntu Software Center или запустив эту команду в терминале:
Gscan2PDF может использовать настраиваемые механизмы распознавания, по умолчанию
tesseract-ocr
Вы можете выбрать подходящий язык. В этом случае вам необходимо установить
tesseract-ocr-LANG
пакет,LANG
в котором указан трехбуквенный код языка ISO 639-2. Сейчас у вас 108 языков на репо 16.04.источник
Я только что имел успех (до 16.04) с pdfocr.rb . Это указано в Ubuntu Wiki
Вот ppa, но хранилище для 16.04 не обновляется. Сценарий ruby выше от github, хотя все еще работает с 16.04.
Вы можете скачать его с Github. Вам понадобятся следующие установленные пакеты:
затем сделал pdfocr.rb исполняемым и запустил:
При желании вы можете использовать
-l LANG
параметр. В этом случае вам необходимо установитьtesseract-ocr-LANG
пакет,LANG
в котором указан трехбуквенный код языка ISO 639-2. Сейчас у вас 108 языков на репо 16.04.источник
Лучший и самый простой выход -
pypdfocr
это не менять PDF. pypdfocr - ссылка на модуль Python здесь.В конце у вас будет другой,
your_document_ocr.pdf
как вы хотите, с возможностью поиска текста. Приложение не меняет качество изображения. Немного увеличивает размер файла, добавляя оверлейный текст.Я думаю, что команда довольно проста, что она не нуждается в графическом интерфейсе. Возможно установка pypdfocr немного более многословна:
Обновление 3 ноября 2018 года:
pypdfocr
больше не поддерживается с 2016 года, и я заметил некоторые проблемы из-за незанятости.ocrmypdf
( модуль выполняет знакомую работу и может использоваться следующим образом:Установить:
или же
источник
Просто потому, что он работает очень хорошо и обязательно должен быть в списке:
Пример gimageReader со скриншота:
Он находится в репозиториях (ответил 18.10, но использовал его целую вечность)
источник
eng
как вариант ... но я решил! :) Запускsudo apt install tesseract-ocr-eng
в терминале сделал свое дело. Было бы хорошо, если бы это было задокументировано в файле справки gimageReader или в «README» на github ... или где-то еще. Как здесь, возможно.gscan2pdf включает в себя 3 различных движка ocr. Вы можете отсканировать прямо в программу или импортировать PDF в программу. Я обнаружил, что движок Tesseract прекрасно работает и очень прост в использовании.
источник