Как извлечь текст из PDF, который не был создан с индексом? Это весь текст, но я не могу ничего искать или выбирать. Я использую Kubuntu, а у Okular нет этой
Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которым можно управлять с помощью текстовых процессоров и т. Д.
Сегодня я получил PDF от нашего поставщика, и он содержал несколько напечатанных и отсканированных страниц с подписями и т. Д. Я открыл его в Acrobat Reader DC. Но, к моему удивлению, текст из явно отсканированных изображений можно было выбрать и скопировать как текст. Смотрите скриншот: Очевидно,...
Это обсуждалось год назад здесь: Пакетное распознавание текста для многих PDF-файлов (еще не распознано)? Есть ли способ пакетной обработки документов OCR PDF, которые еще не были распознаны? Это, я думаю, текущее состояние дел, связанных с двумя проблемами: Пакетное распознавание PDF Windows...
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 4 года назад . У меня есть PDF отсканированной книги. Я ищу бесплатное программное обеспечение, которое выполнит OCR, а...
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 4 года назад . Много раз я сталкивался с растровыми изображениями, в которых не было ничего, кроме текстовых абзацев,...
Я давно ищу в Google, но не могу найти ответ на свой вопрос. У меня есть нежелательные слои распознавания текста в документе, который я недавно сканировал с помощью Adobe Acrobat. Он не был правильно распознан, и я хочу отредактировать некоторую информацию, но OCR создает необходимую информацию для...
Evernote распознает изображения, которые вы сохраняете. Есть ли способ получить полнотекстовый эквивалент изображения в Evernote или OCR предназначен только для
Я был на месте моего деда в прошлые выходные. Моя бабушка вытащила эту гигантскую (~ 1400 страниц) книгу о своей семейной истории, восходящую к 1630 году или около того. Гигантский ботаник, которым я являюсь, я подумал, что было бы замечательно хранить всю информацию в базе данных и получать ее из...
Этот PDF был создан Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf Вы можете скопировать и вставить первое предложение и получить этот (очень хороший) текстовый результат: Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der...
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Супер пользователя. Закрыто 5 лет назад . Я использую Google Desktop Search (я в Vista), и не все мои файлы PDF распознаются в моей папке архива....
Я использовал SimpleOCR , который имеет хороший графический интерфейс для исправления ошибок. К сожалению, он делает много ошибок! (и страдает от других ошибок и ограничений) С другой стороны, Tesseract более точен, но вообще не имеет графического интерфейса. У меня вопрос: есть ли бесплатная...
Обработка OCR занимает много времени. Использование нескольких процессорных ядер ускорит обработку. Acrobat 10 не был многопоточным приложением . Как насчет Acrobat 11? 11 по умолчанию делает OCR, используя несколько процессорных ядер (если доступно)? Если нет, есть ли какие-то обходные пути,...
Как запустить сканирование и распознавание символов с помощью Microsoft Office Word 2010 (бета-версия)? Я не могу найти вариант для сканирования документа в моем сканере непосредственно в документ Word 2010. Я проверил параметры установки для Office 2010 (бета-версия) и элементы OCR...
Время от времени я сталкиваюсь с PDF, который вначале выглядит хорошо, но основной текст искажен. В настоящее время у меня есть PDF, где искажены только заголовки, и я хотел бы знать, можно ли каким-то образом заменить искаженный текст на правильный. Я думал о распознавании определенных страниц,...
Есть ли способ сделать PDF только из слоя скрытого текста файла DjVu? Я умею пользоваться djvused myfile.djvu -e 'output-txt' > myfile.dsed вывести сценарий DjVu, который включает координаты x, y каждого слова каждой страницы, но как мне преобразовать это в PS или PDF? Я уверен, что у кого-то...
клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25...
Я установил (или, по крайней мере, мне кажется, что я запустил установщик) tessearct-ocr на моей машине под управлением 64-битной Windows 7. Я пытаюсь взаимодействовать с программой через cmd. конвертировать .png изображение в текст. я пытался tesseract filename.png filename и получил сообщение об...
Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I...
Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ...
я купил Живое перо который записывает все, что я пишу (и говорю). Тем не менее, он может дать мне только PDF-версии того, что я написал. С помощью MyScript (платное расширение) Я могу заставить его конвертировать свои рукописные заметки в цифровой текст. Но оказывается, что он не очень любит...