Я пытаюсь, для моих собственных учебных целей, разработать реализацию алгоритма, который бы перечислял книги, учитывая изображение книжной полки, например:
Первым шагом является нарезка изображения на отдельные книги.
Мой алгоритм в Mathematica :
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- сделать базовое обнаружение края &
удали текст и постарайся сохранить длинные строки
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
затем удалите ненужные горизонтальные линии
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Результаты, однако, менее чем велики:
Мои вопросы:
- Как я могу улучшить это, чтобы получить лучшие результаты?
- Есть ли более умный способ сделать это?
- как дальше я должен обрабатывать изображения для повышения точности на (более поздней) фазе OCR?
- Как использовать информацию о цвете для улучшения сегментации?
opencv
computer-vision
image-segmentation
Орен Пинский
источник
источник
Ответы:
Вот ссылка на исследовательскую работу, которая пытается сделать то же самое, что вы хотели. Это может помочь вам. Использование функций изображения Также классное видео на YouTube
источник
Какой метод вы используете для обнаружения линий? Вы пробовали экспериментировать с ЛСД ?
Вот результаты быстрого теста, который я сделал с использованием ЛСД:
Второе изображение - это результаты с тем же ограничением угла, но без учета длины сегментов:
Вы можете попробовать поиграть с этим немного, выяснить, как выбрать лучшие отрезки, расширить их до линий и, возможно, получить немного лучшие результаты, чем те, которые вы опубликовали.
источник
Вы можете попробовать определить края на отдельных цветовых доменах, а затем объединить их, используя выбранный вами метод определения границ.
По сравнению с распознаванием краев непосредственно на цветном изображении, оно может дать лучшие результаты.
источник
Можно найти бумагу из неработающей ссылки, предоставленной isrish. Комбинируя функции изображения и текста: гибридный подход к распознаванию позвоночника в мобильной книге , Proc. 19-я международная конференция ACM по мультимедиа, 2011 год. Также можно ознакомиться с другими статьями David Chen et al. Например, отслеживание недорогих активов с использованием телефонов с определением местоположения , Proc. SPIE 2010.
источник