Понимание Теории Масштабного Пространства

10

В теории масштаба пространства масштаб пространстве представление сигнала , (в случае изображения D = 2 ) определяется как: L ( х , y ; t ) = g ( x , y ; t ) f ( x , y ) где g ( x ,f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y) является гауссовым ядром с параметром t и является сверткой. Изменяяпараметр t, мы получаем более или менее сглаженное изображение. В результате более грубое представление (параметр t ) не будет содержать небольших объектов или шума.g(x,y;t)ttt

Суть в том, чтобы найти способ обнаружения инвариантных к масштабу объектов, верно? Таким образом, для некоторого изображения с уменьшенным размером копии функции, такие как ключевые точки, будут обнаружены правильно, даже если размер отличается, без поиска других шумовых ключевых точек.

  1. В работе они используют нормированные производные. δ ξ , γ - n o r m = t γ / 2 δ x . Что означает использование γ- нормализованной производной, как это помогает в масштабно-инвариантности?γδξ,γnorm=tγ/2δxγ

  2. Из этого изображения мы видим, что в почти одинаковых позициях найдены разные ключевые точки (разные по размеру). Как это возможно?

Обнаруженные особенности

x,ytL(x,y)t

Бумага, которую я читал: Обнаружение функций с автоматическим выбором масштаба

Максимус
источник

Ответы:

3
  1. γtt

  2. Вы можете найти ключевые точки в нескольких масштабах в одном месте. Это потому, что вы ищете локальные максимумы за масштабами. Вот интуиция: подумай об образе лица. В мелком масштабе вы получите каплю, соответствующую носу. В масштабе курса вы получите пятно, соответствующее всему лицу. Два сгустка отцентрированы в одной точке, но имеют разные масштабы.

  3. Вот весь алгоритм:

    • Решите, какие функции изображения вам интересны (например, пятна, углы, края)
    • Определите соответствующую «функцию детектора» в терминах производных, например, лапласиан для блобов.
    • Вычислите производные, которые вам нужны для работы вашего детектора в различных масштабах.
    • tmγ/2m
    • Вычислить функцию детектора по всему пространству масштаба.
    • x,y,t
    • Это ваши точки интереса или ключевые моменты.

Редактировать:

  1. tγ/2
  2. txytxy
  3. Вы хотите найти локальные максимумы по шкалам, потому что у вас могут быть изображения разных размеров в одном месте. Представьте себе изображение концентрических кругов, как бычий глаз. Это даст вам высокую реакцию лапласиана в нескольких масштабах. Или подумайте об изображении реального человеческого глаза, отфильтрованного лапласианом в разных масштабах. Вы получите высокий отклик в мелком масштабе для ученика, высокий отклик в некотором среднем масштабе для радужной оболочки и высокий отклик в грубом масштабе для всего глаза.

Все дело в том, что вы не знаете, в каком масштабе интересующие вас особенности могут опередить время. Итак, вы смотрите на все шкалы.

Дима
источник
tγ/2tttx,y
x,y,tt
@maximus Пожалуйста, смотрите изменения к ответу.
Дима
@maximus, я не так поняла раньше. гамма не уровень шкалы. Я исправил ответ.
Дима