Я пытаюсь найти список возможных функций изображения, таких как цвет, ориентированные края и т. Д., Для измерения их пригодности в случае обнаружения одинаковых / похожих объектов на изображениях. Кто-нибудь знает такой список или хотя бы какие-то особенности?
image-processing
cbir
JStr
источник
источник
Ответы:
Само поле слишком обширно. Поэтому я сомневаюсь, что у вас может быть полный список здесь. Тем не менее, MPEG 7 является одним из основных усилий в стандартизации этой области. То, что здесь включено, не является универсальным - но, по крайней мере, самым основным.
Вот некоторые ключевые функции, которые определены в MPEG7 (я действительно могу говорить только о визуальных дескрипторах, но другие не видят это в полном объеме).
Существует 4 категории визуальных дескрипторов:
1. Цветовые дескрипторы, которые включают в себя:
Доминирующий цвет,
Цветовая компоновка (по существу, Основной цвет на блочной основе),
Масштабируемый Цвет (по существу, Цветовая гистограмма),
Структура Цвета (по существу, локальная Цветовая гистограмма)
и Цветовые пространства, чтобы сделать вещи совместимыми.
2. Текстовые дескрипторы (см. Также это ), который включает в себя:
Дескриптор просмотра текстуры - который определяет гранулярность / грубость, регулярность и направление. Дескриптор однородной текстуры - основан на банке фильтров Габора. и
краевая гистограмма
3. Дескрипторы формы, которые включают:
Дескрипторы на основе области - это скалярные атрибуты рассматриваемой формы, такие как площадь, эксцентриситеты и т. Д. На
основе контура, который фиксирует фактические характерные особенности формы и
3D-дескрипторы
4. Дескрипторы движения для
движения видеокамеры (параметры движения трехмерной камеры)
Траектория движения (объектов в сцене) [например, извлеченные алгоритмами отслеживания] Параметрическое движение (например, векторы движения, которые позволяют описать движение сцены. Но это может быть более сложными моделями на различных объектах).
Деятельность, которая больше семантического дескриптора.
MPEG 7 не определяет «Как они извлекаются» - он только определяет, что они означают и как их представлять / хранить. Таким образом, существуют исследования о том, как их добывать и использовать.
Вот еще одна хорошая статья, которая дает представление об этой теме.
Но да, многие из этих функций довольно просты и, возможно, в результате дополнительных исследований будет создан более сложный (и сложный) набор функций.
источник
Хорошо, я думаю, что нашел подходящий список, просто выполнив поиск немного больше. Есть статья Deselaers и др. какие швы должны быть тем, что я искал!
источник
Существует также книга, которая объединяет ряд документов, связанных с этой темой. Это называется Принципы визуального поиска информации .
источник
@Dipan Mehta описал дескрипторы функций, которые можно использовать. Позвольте мне теперь попытаться покрыть другую сторону медали, упомянув некоторые методы обнаружения признаков, которые извлекают функции, полезные для CBIR .
Моя ссылка для моего CBIR исследования были работы по Sivic, Зиссерман и Нистера, Stewenius . Есть более современные статьи этих авторов, но в них представлены все соответствующие идеи.
Они утверждают, что для реализации эффективных методов CBIR следует использовать функции дополнительных свойств :
Адаптированные к форме области - как правило, центрированы в угловых элементах
примеры: углы Харриса, многомасштабный Харрис, DoG (разница с гауссианами - но также реагирует на грани!)
Предельно стабильные регионы -правило, сосредоточены на шарикообразных функции
примеры: MSER (максимально стабильные внешние области), DoG
Удивительно, но Википедия также предлагает хорошую классификацию типов объектов (детекторов) с указанием типов областей интереса, которые они обнаруживают для большинства текущих широко используемых функций:
Большинство текущих статей, которые я читал, клянутся, что дескрипторы SIFT (масштабно-инвариантное преобразование объектов) качаются и достаточно надежны для использования в сочетании с выбранными детекторами признаков. Рекомендации включают в себя:
Заметка! что эти документы не имеют прямого отношения к CBIR, но используются в качестве ссылок в работах, связанных с CBIR .
Наконец, стоит упомянуть, что успешные методы CBIR зависят не только от используемых детекторов функций и дескрипторов , но также:
Кроме того, я уже ответил на некоторые вопросы, касающиеся CBIR для DSP и stackoverflow , оба сопровождаются ссылками и пояснениями, и я думаю, что они могут быть актуальны, поэтому вы можете посмотреть:
источник