Как получить скриншот лучшего качества для оптического распознавания символов?

2

Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ сделать скриншоты для OCR?

Прямо сейчас я получаю довольно хорошие результаты с бесплатными онлайн-инструментами, такими как new-ocr, но он допускает ошибки, которые мне приходится время от времени исправлять. Так что я хотел бы несколько советов. Я также протестировал скриншот ABBYY, и это было довольно плохо ... онлайн-инструменты лучше.

Gih
источник
Я использую программу чтения скриншотов ABBYY, и она отлично работает для меня. Я только что проверил это снова на ваш собственный вопрос. Интересно, если ваши задачи особенно сложны по какой-то причине?
texnic

Ответы:

1

С 21 июня 2011 года вы можете использовать Google Docs для скриншотов OCR в пакете.

Вы можете загрузить папку с изображениями и преобразовать их в документы, которые будут содержать как изображение, так и текст OCRed.

Затем вы можете пакетно загрузить все эти документы в виде обычного текста, который вычеркнет изображение.

Если ваши скриншоты имеют уникальные имена файлов, связать их с текстом OCRed должно быть тривиально практически в любой системе.

Макс Масник
источник
4

У меня недавно была похожая потребность (не для скриншота, а для страницы по факсу). Ocrterminal.com отлично поработал, он бесплатный и быстрый для определенного количества конверсий в месяц (я думаю, 20?). Друг использует Tesseract , который основан на командной строке и, кажется, также работает нормально.

user33851
источник
Я использовал newocr.com, который также быстрый и бесплатный. Это сработало хорошо, но я исправил множество ошибок. О, хорошо, я не могу быть жадным, дело в том, чтобы делать фотографии и превращать их в текст, хе-хе ...
GiH
1

ScreenOCR (21-дневная пробная версия ) утверждает, что хорошо справляется со скриншотами (что вам поможет). Я не пробовал это все же.

Хью Аллен
источник
0

Я бы предположил, что, поскольку на снимках экрана используется шрифт вместо рукописного ввода с разрешением 75 точек на дюйм, это не так уж плохо.

Джош К
источник
Вы будете иногда удивлены, это не соответствует вообще
GiH
0

Я использую GreenShot для экранных крышек

Shevek
источник
1
говорить об OCR ...
GiH
Да, я не был уверен, так как вторая часть вопроса была немного двусмысленной;) Спасибо за обновление, чтобы уточнить.
Шевек