Есть ли бесплатная библиотека OCR для Android? [закрыто]
148
Я ищу OCR Java, который работает на Android, однако Asprise, похоже, не является независимым от платформы OCR. Есть ли какой-либо OCR с открытым исходным кодом, который я могу использовать для разработки приложений для Android?
Оптическое распознавание текста может сильно загружать процессор, возможно, вы захотите пересмотреть это на смартфоне.
Кроме того, насколько мне известно, популярными библиотеками OCR являются Aspire и Tesseract . Ни один из них не является прямым Java, так что вы не получите встроенную библиотеку Android OCR.
Тем не менее, Tesseract имеет открытый исходный код (размещенный на GitHub infact); так что вы можете потратить некоторое время на портирование нужного вам набора на Java. Насколько я понимаю, это не безумный C ++, поэтому, в зависимости от того, насколько сильно вам нужно OCR, это может стоить времени.
перенося его, вы имеете в виду переписать подмножество в Java? Это может занять много усилий, так что там нет 100% Java OCR?
user121196
13
Я бы порекомендовал попробовать обернуть Tesseract в слой JNI через Android NDK, а не пытаться перенести его на Java Android. Тессеракт, похоже, уже портирован на ARM, поэтому проще установить поверх него JNI API. Кроме того, это поддерживает скорость (эр), чем любой порт Java, и упростит долгосрочное обслуживание.
Вопрос закрыт, но хорошо бы найти кого-то, у кого были положительные результаты. Очень сложно найти людей в этих проектах типа sourceforge. Вопрос: пробовали ли вы Tesseract с изображениями паспортов или документов, удостоверяющих личность? С текстовыми PDF-файлами все в порядке, но я борюсь с изображениями.
PKHunter
Я не пробовал ничего с изображениями, это был просто документ с текстом (тот же шрифт, шрифт, размер)
Бен Пирсон,
Я надеюсь, что это работает для меня
Романтик Электрон
20
Другим вариантом может быть отправка изображения в веб-приложение (возможно, в более поздний момент) и его обработка OCR там без проблем с портом C ++ -> Java и, возможно, засорение мобильного ЦП.
Но OCR очень обширный. Я знаю приложение для Android, которое имеет функцию распознавания текста, но это может быть не тот вид распознавания, который вы ищете.
Это приложение с открытым исходным кодом называется Aedict , и оно выполняет распознавание рукописных японских символов. Это не так медленно.
Если это не то, что вы ищете, уточните, какие символы и какой ввод данных (история касания XY).
Ответы:
Оптическое распознавание текста может сильно загружать процессор, возможно, вы захотите пересмотреть это на смартфоне.
Кроме того, насколько мне известно, популярными библиотеками OCR являются Aspire и Tesseract . Ни один из них не является прямым Java, так что вы не получите встроенную библиотеку Android OCR.
Тем не менее, Tesseract имеет открытый исходный код (размещенный на GitHub infact); так что вы можете потратить некоторое время на портирование нужного вам набора на Java. Насколько я понимаю, это не безумный C ++, поэтому, в зависимости от того, насколько сильно вам нужно OCR, это может стоить времени.
Итак, короткий ответ: Нет.
Длинный ответ: если вы готовы работать на это.
источник
У меня довольно много удачи с tesseract-android-tools
источник
Другим вариантом может быть отправка изображения в веб-приложение (возможно, в более поздний момент) и его обработка OCR там без проблем с портом C ++ -> Java и, возможно, засорение мобильного ЦП.
источник
Google Goggles - идеальное приложение для распознавания текста и перевода.
И хорошая новость в том, что Google Goggles станет платформой приложений .
До этого вы можете использовать IQ Engines .
источник
Да, есть.
Но OCR очень обширный. Я знаю приложение для Android, которое имеет функцию распознавания текста, но это может быть не тот вид распознавания, который вы ищете.
Это приложение с открытым исходным кодом называется Aedict , и оно выполняет распознавание рукописных японских символов. Это не так медленно.
Если это не то, что вы ищете, уточните, какие символы и какой ввод данных (история касания XY).
источник
Вы можете использовать читатель OCR Google Docs .
источник