Вопросы с тегом «ocr»

Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которым можно управлять с помощью текстовых процессоров и т. Д.

32
Как создать PDF со отсканированными страницами, но выбрать текст?

Сегодня я получил PDF от нашего поставщика, и он содержал несколько напечатанных и отсканированных страниц с подписями и т. Д. Я открыл его в Acrobat Reader DC. Но, к моему удивлению, текст из явно отсканированных изображений можно было выбрать и скопировать как текст. Смотрите скриншот: Очевидно,...

20
Пакетная OCR много PDF-файлов

Это обсуждалось год назад здесь: Пакетное распознавание текста для многих PDF-файлов (еще не распознано)? Есть ли способ пакетной обработки документов OCR PDF, которые еще не были распознаны? Это, я думаю, текущее состояние дел, связанных с двумя проблемами: Пакетное распознавание PDF Windows...

19
Как я могу преобразовать отсканированные изображения в формате PDF в PDF-файл с возможностью поиска? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 4 года назад . У меня есть PDF отсканированной книги. Я ищу бесплатное программное обеспечение, которое выполнит OCR, а...

15
Как я могу определить шрифты на изображении? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 4 года назад . Много раз я сталкивался с растровыми изображениями, в которых не было ничего, кроме текстовых абзацев,...

13
Как удалить OCR из PDF?

Я давно ищу в Google, но не могу найти ответ на свой вопрос. У меня есть нежелательные слои распознавания текста в документе, который я недавно сканировал с помощью Adobe Acrobat. Он не был правильно распознан, и я хочу отредактировать некоторую информацию, но OCR создает необходимую информацию для...

13
Извлечение текста OCR из Evernote

Evernote распознает изображения, которые вы сохраняете. Есть ли способ получить полнотекстовый эквивалент изображения в Evernote или OCR предназначен только для

12
Практическое решение для оптического распознавания текста для преобразования большой книги в цифровой формат?

Я был на месте моего деда в прошлые выходные. Моя бабушка вытащила эту гигантскую (~ 1400 страниц) книгу о своей семейной истории, восходящую к 1630 году или около того. Гигантский ботаник, которым я являюсь, я подумал, что было бы замечательно хранить всю информацию в базе данных и получать ее из...

10
PDF имеет дополнительный пробел во всех словах после запуска через Ghostscript

Этот PDF был создан Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf Вы можете скопировать и вставить первое предложение и получить этот (очень хороший) текстовый результат: Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der...

9
Пакетное распознавание текста для многих PDF-файлов (еще не распознано)? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 5 лет назад . Я использую Google Desktop Search (я в Vista), и не все мои файлы PDF распознаются в моей папке архива....

9
Хороший бесплатный OCR с графическим интерфейсом для исправления ошибок? (для Windows)

Я использовал SimpleOCR , который имеет хороший графический интерфейс для исправления ошибок. К сожалению, он делает много ошибок! (и страдает от других ошибок и ограничений) С другой стороны, Tesseract более точен, но вообще не имеет графического интерфейса. У меня вопрос: есть ли бесплатная...

8
Можно ли с помощью Acrobat 11 выполнять распознавание текста, используя несколько процессорных ядер?

Обработка OCR занимает много времени. Использование нескольких процессорных ядер ускорит обработку. Acrobat 10 не был многопоточным приложением . Как насчет Acrobat 11? 11 по умолчанию делает OCR, используя несколько процессорных ядер (если доступно)? Если нет, есть ли какие-то обходные пути,...

8
Как запустить сканирование OCR в Microsoft Office Word 2010?

Как запустить сканирование и распознавание символов с помощью Microsoft Office Word 2010 (бета-версия)? Я не могу найти вариант для сканирования документа в моем сканере непосредственно в документ Word 2010. Я проверил параметры установки для Office 2010 (бета-версия) и элементы OCR...

3
Заменить (OCR) искаженный текст в PDF?

Время от времени я сталкиваюсь с PDF, который вначале выглядит хорошо, но основной текст искажен. В настоящее время у меня есть PDF, где искажены только заголовки, и я хотел бы знать, можно ли каким-то образом заменить искаженный текст на правильный. Я думал о распознавании определенных страниц,...

2
DjVu скрытый текст → PDF?

Есть ли способ сделать PDF только из слоя скрытого текста файла DjVu? Я умею пользоваться djvused myfile.djvu -e 'output-txt' > myfile.dsed вывести сценарий DjVu, который включает координаты x, y каждого слова каждой страницы, но как мне преобразовать это в PS или PDF? Я уверен, что у кого-то...

2
Как извлечь текст из PDF-файла на основе изображений с помощью Cuneiform в терминале

клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25...

2
Почему Tesseract CLI показывает «не удается создать выходной файл» в Windows 7?

Я установил (или, по крайней мере, мне кажется, что я запустил установщик) tessearct-ocr на моей машине под управлением 64-битной Windows 7. Я пытаюсь взаимодействовать с программой через cmd. конвертировать .png изображение в текст. я пытался tesseract filename.png filename и получил сообщение об...

2
AutoHock для поиска изображений

Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I...

2
Как получить скриншот лучшего качества для оптического распознавания символов?

Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ...

2
Что такое хорошее программное обеспечение для распознавания рукописного ввода?

я купил Живое перо который записывает все, что я пишу (и говорю). Тем не менее, он может дать мне только PDF-версии того, что я написал. С помощью MyScript (платное расширение) Я могу заставить его конвертировать свои рукописные заметки в цифровой текст. Но оказывается, что он не очень любит...