Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ сделать скриншоты для OCR?
Прямо сейчас я получаю довольно хорошие результаты с бесплатными онлайн-инструментами, такими как new-ocr, но он допускает ошибки, которые мне приходится время от времени исправлять. Так что я хотел бы несколько советов. Я также протестировал скриншот ABBYY, и это было довольно плохо ... онлайн-инструменты лучше.
screenshot
ocr
Gih
источник
источник
Ответы:
С 21 июня 2011 года вы можете использовать Google Docs для скриншотов OCR в пакете.
Вы можете загрузить папку с изображениями и преобразовать их в документы, которые будут содержать как изображение, так и текст OCRed.
Затем вы можете пакетно загрузить все эти документы в виде обычного текста, который вычеркнет изображение.
Если ваши скриншоты имеют уникальные имена файлов, связать их с текстом OCRed должно быть тривиально практически в любой системе.
источник
У меня недавно была похожая потребность (не для скриншота, а для страницы по факсу). Ocrterminal.com отлично поработал, он бесплатный и быстрый для определенного количества конверсий в месяц (я думаю, 20?). Друг использует Tesseract , который основан на командной строке и, кажется, также работает нормально.
источник
ScreenOCR (21-дневная пробная версия ) утверждает, что хорошо справляется со скриншотами (что вам поможет). Я не пробовал это все же.
источник
Я бы предположил, что, поскольку на снимках экрана используется шрифт вместо рукописного ввода с разрешением 75 точек на дюйм, это не так уж плохо.
источник
Я использую GreenShot для экранных крышек
источник