Я искал алгоритмы обнаружения маркеров для использования с приложением, основанным на kinect, и большая часть работы, которую я смог найти, очевидно, сосредоточена на обнаружении признаков в «нормальных» изображениях.
Однако аппаратное обеспечение kinect обеспечивает (по сути, после того, как вы настроили) 11-битное значение глубины на пиксель.
Это глубинное изображение также содержит различные визуальные артефакты от теней, отбрасываемых по краям объектов (см., Например, сильную черную рамку в этом видео http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Хотя некоторые традиционные методы машинного зрения (например, обнаружение контуров) хорошо работают с этим, другие - нет, и кажется, что в сети мало информации об этом.
В качестве простого примера, использование значения глубины делает тривиальным определение ориентации блока маркера после его нахождения.
Итак, кто-нибудь видел какие-либо обсуждения / документы / и т. Д., Которые охватывают обработку изображения глубины для обнаружения признаков?
Кто-нибудь может порекомендовать хороший алгоритм для определения маркеров «глубины» (эффективно блоков оригами вместо печатных ч / б маркеров)?
До сих пор я проводил эксперименты adhoc с использованием opencv для обработки изображений, но это далеко не так стабильно или достаточно быстро.
Если вы ссылаетесь на коммерческий продукт машинного зрения без каких-либо испытаний, укажите в своем ответе, почему вы считаете это целесообразным.
источник
Ответы:
Моим любимым дескриптором функций 2.5D / 3D для регистрации и распознавания является вращающееся изображение (оригинал статьи + больше деталей в диссертации и программное обеспечение, доступное в CMU).
Другие последние достижения (все доступные для поиска в режиме онлайн для подходящих алгоритмов) включают в себя: 3D-просеивание, гистограмма объектов с быстрой точкой, радиально-ориентированные радиальные объекты (NARF), дескрипторы ядра глубины. Старые методы просто использовали свойства поверхности, такие как кривизна и края, чтобы идентифицировать участки области.
Какой лучше? Зависит от того, что вы хотите найти, неизменность точки обзора, дополнительный беспорядок и т. Д.
источник
Вы правильно поняли все ключевые слова, я удивлен, что вы действительно не нашли связанных статей при поиске материала.
К счастью, у меня есть доступ к цифровой библиотеке IEEE Xplore. Раньше мне не требовался какой-либо из этих конкретных алгоритмов, но он выглядит очень интересным, поэтому вот некоторые результаты быстрого поиска, которые, на мой взгляд, могут быть актуальны (не судите их по названиям, посмотрите их рефераты):
К сожалению, я не думаю, что вы можете получить доступ к любому из этих документов бесплатно, по крайней мере, через библиотеку IEEE Xplore. Если у вас нет доступа, вы, вероятно, можете обойтись с ученым Google , и там есть несколько бесплатных бумажных баз данных (я использовал базу данных Mendeley еще тогда, когда у меня еще не было доступа к IEEE). Кроме того, просто поиск частей абстрактной или случайной части статьи в Google иногда дает некоторые результаты (вы можете наткнуться на почти готовые предварительно опубликованные версии статьи).
Поисковыми запросами, которые я использовал для поиска упомянутых работ, были: 3D-изображение , глубина изображения , Kinect . Вы также можете добавить обработку при поиске первых двух запросов.
Надеюсь, это поможет некоторым! Мне жаль, что я не могу больше вдаваться в тему, звучит действительно интересно.
источник