Понимание Теории Масштабного Пространства

В теории масштаба пространства масштаб пространстве представление сигнала , (в случае изображения ) определяется как: где $f(x), x = (x_1, ..., x_d)$ $d = 2$ $L(x, y; t) = g(x, y; t) * f(x, y)$ является гауссовым ядром с параметром и является сверткой. Изменяяпараметр мы получаем более или менее сглаженное изображение. В результате более грубое представление (параметр ) не будет содержать небольших объектов или шума. $g(x, y; t)$ $t$ $*$ $t$ $t$

Суть в том, чтобы найти способ обнаружения инвариантных к масштабу объектов, верно? Таким образом, для некоторого изображения с уменьшенным размером копии функции, такие как ключевые точки, будут обнаружены правильно, даже если размер отличается, без поиска других шумовых ключевых точек.

В работе они используют нормированные производные. . Что означает использование нормализованной производной, как это помогает в масштабно-инвариантности? $\gamma$ $\delta_{\xi, \gamma-norm} = t^{\gamma / 2} \delta_x$ $\gamma$
Из этого изображения мы видим, что в почти одинаковых позициях найдены разные ключевые точки (разные по размеру). Как это возможно?

Обнаруженные особенности

$x, y$ $t$ $L$ $(x, y)$ $t$

Бумага, которую я читал: Обнаружение функций с автоматическим выбором масштаба

image-processing computer-vision scale-space Максимус
источник

Ответы:

$\gamma$ $t$ $t$
Вы можете найти ключевые точки в нескольких масштабах в одном месте. Это потому, что вы ищете локальные максимумы за масштабами. Вот интуиция: подумай об образе лица. В мелком масштабе вы получите каплю, соответствующую носу. В масштабе курса вы получите пятно, соответствующее всему лицу. Два сгустка отцентрированы в одной точке, но имеют разные масштабы.
Вот весь алгоритм:
- Решите, какие функции изображения вам интересны (например, пятна, углы, края)
- Определите соответствующую «функцию детектора» в терминах производных, например, лапласиан для блобов.
- Вычислите производные, которые вам нужны для работы вашего детектора в различных масштабах.
- $t^{m \gamma / 2}$ $m$
- Вычислить функцию детектора по всему пространству масштаба.
- $x, y, t$
- Это ваши точки интереса или ключевые моменты.

Редактировать:

$t^{\gamma / 2}$
$t$ $x$ $y$ $t$ $x$ $y$
Вы хотите найти локальные максимумы по шкалам, потому что у вас могут быть изображения разных размеров в одном месте. Представьте себе изображение концентрических кругов, как бычий глаз. Это даст вам высокую реакцию лапласиана в нескольких масштабах. Или подумайте об изображении реального человеческого глаза, отфильтрованного лапласианом в разных масштабах. Вы получите высокий отклик в мелком масштабе для ученика, высокий отклик в некотором среднем масштабе для радужной оболочки и высокий отклик в грубом масштабе для всего глаза.

Все дело в том, что вы не знаете, в каком масштабе интересующие вас особенности могут опередить время. Итак, вы смотрите на все шкалы.

Дима
источник

t^{γ / 2}

$t^{\gamma / 2}$

t

$t$

t

$t$

t

$t$

x, y

$x,y$

x, y, t

$x,y,t$

t

$t$

@maximus Пожалуйста, смотрите изменения к ответу.

Дима

@maximus, я не так поняла раньше. гамма не уровень шкалы. Я исправил ответ.

Дима