Алгоритмы регистрации изображений обычно основаны на точечных объектах, таких как SIFT (масштабно-инвариантное преобразование объектов).
Я видел некоторые ссылки на линейные объекты, но мне было интересно, можно ли будет совмещать сегменты изображения вместо точек . Например, данный источник и преобразованное изображение:
Я могу сделать обнаружение краев, размытие и Watershed Transform для каждого:
К сожалению, сегментация оказалась слишком разной на каждом изображении, чтобы соответствовать отдельным сегментам.
Я видел несколько работ по сопоставлению форм и дескрипторов форм, которые инвариантны к аффинным преобразованиям, поэтому эта область выглядит многообещающей ...
Существуют ли какие-либо методы сегментации, более устойчивые к аффинным (или даже проективным) деформациям изображения?
Ответы:
MSER (максимально устойчивые экстремальные области) - это области, а не точки. И они инвариантны к аффинной трансформации. Но это не метод сегментации, строго говоря
Неформально говоря, идея состоит в том, чтобы найти капли с различными порогами, а затем выбрать капли, которые имеют наименьшее изменение формы / площади в диапазоне порогов. Эти области должны быть стабильными для большого диапазона градаций серого и геометрических преобразований.
источник
В настоящее время я работаю над CBIR, используя деревья компонентов , что должно быть относительно новой идеей. Некоторые ожидаемые преимущества использования деревьев компонентов для описания изображений:
Поскольку я только начал исследования, связанные с этой темой, у меня есть лишь смутное представление о моих целях: представить изображение с помощью дерева компонентов, а затем сравнить указанные деревья компонентов, либо непосредственно, найдя векторизованное представление. Я, вероятно, смогу сказать гораздо больше через несколько недель (или месяцев), но сейчас я могу предложить только список статей, рекомендованных мне в качестве введения в деревья компонентов (я их еще не читал):
Я могу обновить ответ, если найду что-то подходящее.
Кроме того , если ваша цель состоит в том, чтобы, таким образом, более точно соответствовать изображениям регионов , а не только точек , потому что регионы могут быть более дискриминационными, было приятно предложение в J. Sivic и А. Зиссермане: «Видео Google: текстовое индексирование Подход к сопоставлению объектов в видео » .
Я имею в виду раздел, посвященный пространственной согласованности , где группа совпадений между характерными точками принимается, только если характерные точки сохраняют одинаковую пространственную конфигурацию на обоих изображениях. Таким образом, сопоставление зависит не только от типа извлеченного признака (DoG, MSER, ...) или дескриптора (SIFT), но оно также смотрит на более широкое окружение характерной точки, делая его (хотя бы немного) зависит от региона.
источник