Программное обеспечение OCR для рукописных заметок

10

Я ищу способ распознавания почерка отсканированных заметок (в формате PDF).

Это не должно быть идеально, и это не должно быть бесплатным, но перед оплатой я хотел бы попробовать это (даже с одной страницей).

Это не обязательно должно быть родное приложение Mac OS X. Я буду в порядке с онлайн-приложением или Unix-приложением для установки или компиляции. Другими словами, все, что работает несколько прилично, будет в порядке.

Я также не обязательно ищу идеальный результат. Даже преобразование моих заметок в доступный для поиска PDF-файл, содержащий только часть распознанного текста, было бы лучше, чем ничего.

Matteo
источник
1
К сожалению, у меня есть ощущение, что вы можете бороться с распознаванием почерка. Например, статья Wikipedia по распознаванию рукописного текста утверждает, что « Распознавание рукописного текста в автономном режиме сравнительно сложно, так как разные люди имеют разные стили рукописного ввода. И на сегодняшний день механизмы распознавания в основном ориентированы на машинный печатный текст и ICR для ручной« печати »( написано заглавными буквами) текст. На сегодняшний день не существует механизма OCR / ICR, который бы поддерживал распознавание рукописного текста. "
binarybob
См. Также: softwarerecs.stackexchange.com/q/16857/14234
aparente001

Ответы:

4

Если вы знакомы с любым языком программирования, взгляните на @ ocrsdk.com, это веб-сайт, который позволяет загружать изображения через веб-API и отправляет вам данные OCRed. Вот документация на распознавание рукописного текста: http://ocrsdk.com/documentation/quick-start/text-fields/ и вот некоторые codesamples @ GitHub: https://github.com/abbyysdk/ocrsdk.com Там хорошая 50 страницы бесплатной пробной версии без каких-либо предварительных платежей.

Николай
источник
4

Evernote имеет распознавание рукописного ввода, но, к сожалению, сейчас требует формат JPG . Он не может обрабатывать PDF-файлы. Таким образом, ваш обходной путь может заключаться в преобразовании PDF -> JPG с использованием Preview и т. Д., А затем импортировании в Evernote для распознавания. К вашему сведению, распознавание рукописного ввода в Evernote для JPG является приличным, но, судя по моему опыту, не совсем на уровне распознавания текста.

Кроме того, в этом посте описан хороший рабочий процесс для использования Evernote для распознавания рукописных заметок.

ckib16
источник
4

Вы можете использовать Evernote для этого (бесплатно). Просто импортируйте все свои PDF-файлы в виде заметок и через некоторое время (вы можете ускорить это, перейдя на платную учетную запись), он автоматически обработает их и распознает почерк. Вы не сможете извлечь текст OCR из заметок, но вы можете найти его.

Senseful
источник
Я пытался, но пока ничего не произошло (спустя почти два дня). Нужно ли каким-либо образом запускать OCR?
Маттео
1
Через месяц все еще ничего. Я думаю, что я опущу Evernote как возможность :-)
Matteo
Хм, в ваших PDF есть какой-нибудь распознанный текст? (т.е. можете ли вы выделить напечатанный текст и скопировать его?) Если это так, это означает, что документ считается уже обработанным и серверы Evernote не будут пытаться запустить OCR для него. Гарантированный метод распознавания текста (по крайней мере, в целях тестирования) - преобразовать несколько страниц в изображения (например, PNG) и затем добавить их в виде заметок; затем посмотрите, сможете ли вы через некоторое время найти почерк на этих изображениях. Вы также всегда можете обратиться в службу поддержки Evernote, они обычно очень полезны.
Чувственный
Evernote делает разумную работу, если ваше письмо ясно и написано обычным способом. Это лучше всего работает со шрифтами, если вы не хотите адаптировать свой почерк в соответствии с его процессором. Мой почерк очень аккуратный, но у Evernote есть проблемы с моим уникальным стилем (много лигатур и цифр «старого стиля»). Я предпочитаю не менять то, что естественно для приложения.
штатском
3

Я понимаю, что вы ищете приложение для Mac OS, но для удобства читателей, привлеченных к этой теме поиском распознавания рукописного текста, я бы хотел упомянуть MyScript Memo и Notes Plus на iOS. У них общий механизм распознавания рукописного ввода, который, кажется, очень хорошо работает в моих руках. MyScript memo имеет бесплатную версию, которую может попробовать любой пользователь устройства iOS.

(Я также вижу, что вы хотите распознать рукописные заметки, отсканированные с бумаги, чего не могут делать эти приложения. Они распознают рукописные заметки, написанные непосредственно на устройстве iOS.)

ясень
источник
1

Вы проверили Captricity ? Это веб-интерфейс, и у них есть мобильное приложение. Они используют комбинацию компьютерных алгоритмов и человеческого интеллекта, поэтому они работают намного лучше с почерком, чем любое простое программное обеспечение для распознавания текста. Это довольно быстро (порядка часа или двух на несколько десятков или даже сотен страниц), и хотя это не бесплатно, есть только цена за страницу.

Когда я попробовал это, это было свободно настроить учетную запись (это заняло у меня около 15 секунд), и я получил свои первые 25 страниц бесплатно. Похоже, они все еще раздают первые 25 страниц бесплатно. Я нашел это действительно простым в использовании. Я загрузил сканы некоторых форм, которые были заполнены вручную, пометил шаблон, указывающий Captricity, где данные, которые я хотел, затем загрузил целую партию сканов. Я слышал, что фотографии тоже хорошо работают.

Капризность вернула мне электронные, машиночитаемые данные. Лучшая вещь, которую я нашел до сих пор для почерка, и я много смотрел.

Сара С
источник
3
Вы как-то связаны с компанией или просто счастливым клиентом?
холме
1
Капризность работает только с простыми формами. Я попробовал с 25 страницами, и ничего не было признано. Я получил электронное письмо со следующим текстом: «В настоящее время мы можем обрабатывать только структурированный текст с различными полями данных, которые можно вывести в электронную таблицу. Например, мы могли бы хорошо обработать опрос или налоговую форму, но не долго письмо или страница заметок. Хотелось бы, чтобы было лучшее решение. Насколько нам известно, OCR работает не очень хорошо. Мы планируем обрабатывать текст как этот один день, но на данный момент, боюсь, мы не сможем. "
Маттео
0

http://www.VelOCRaptor.com/ кажется доступным (БЕСПЛАТНЫМ!) решением для OS X. У него очень простой пользовательский интерфейс с возможностью перетаскивания. Он основан на технологии распознавания текста Google, поэтому вы можете быть уверены, что он будет работать правильно.

Надеюсь это поможет!

sgonzalez
источник
1
На самом деле не является бесплатным (29 $, что не было бы проблемой), не работает на Lion (это проблема) и поддерживает только печатный текст (как указано в вопросе, я ищу распознавания рукописного ввода).
Маттео
0

Мозговой инструмент ... На рынке нет лучшего продукта, и точка!

Greg
источник
4
Можете ли вы объяснить, что же такого хорошего в этом продукте? Как вы считаете это полезным?
Даниил
1
Вам нужно предоставить больше информации, ссылку, описание, что-то, кроме названия продукта.
Stuff
Brainware был приобретен Hyland, и, похоже, продукт для одного пользователя недоступен.
aparente001
-1

Вы пробовали Abbyy Finereader ?

burn3r
источник
2
Из описания продукта кажется, что он может распознать только напечатанный текст (без почерка).
Маттео