Какой показатель расстояния я могу использовать для сравнения изображений?

14

Я обычно использую среднеквадратическую ошибку (MSE) или пиковое отношение сигнал / шум (PSNR) для сравнения двух изображений, но этого недостаточно. Мне нужно найти формулу, которая возвращает очень большое расстояние между изображением A и его пиксельной (или размытой) версией B, но я не знаю, как действовать дальше. Что будет хорошим показателем для моих нужд?

lezebulon
источник
3
Вы хотите сказать, что у вас будет 2 изображения, полученные из одного и того же источника, 1 будет неизменным, а затем другим размытым, а затем вы захотите определить, какое из них размытое?
Келленджб,
2
Какова природа пикселизации / размытия? Было ли это из-за плохих условий захвата (шум пикселей и не в фокусе) или цифровых манипуляций?
Rwong

Ответы:

7

Следующее не предназначено, чтобы быть ответом, но является статистикой, которая поможет нам выбрать подходящий метод сравнения изображений, основанный на характеристиках изображений, которые вы анализируете.

Первым шагом является построение «дельта-гистограммы» следующим образом:

for (x,y) in [0, width] x [0, height] begin
    delta = abs( SecondImage(x, y) - FirstImage(x, y) )
    hist[delta] += 1
end

Учитывая график этой гистограммы, мы узнаем немного больше о «величине» изменений, которые вы ищете, и сделаем лучшие рекомендации.

(В качестве альтернативы, опубликуйте несколько образцов изображений. Помните, что если образцы изображений не отражают различий в изображениях, которые вас интересуют, мы могли бы дать плохие рекомендации.)


Вы также можете проверить структурное сходство (SSIM) на своем наборе изображений и опубликовать результаты здесь. Помните, что SSIM разработан для того, чтобы имитировать способность человека распознавать препятствие ухудшению изображения, поэтому он может обнаруживать пикселизацию, но, возможно, не размывать.


Если ваши изображения не являются фотографическими изображениями (или являются научными изображениями, которые не являются обычными объектами фотографии), пожалуйста, также опубликуйте примеры их 2D автокорреляции, соответствующим образом обрезанные и масштабированные.


Распознавание лиц - слишком большая тема для обсуждения в одном вопросе. Размытие возникает в нескольких контекстах при распознавании лиц - это может быть проблемой качества данных, или это может быть сделано намеренно как промежуточный этап в обработке данных.

В распознавании лиц мы хотим определить идентичность лиц, поэтому мы должны игнорировать различия изображений, которые не вызваны различиями идентичности. Основная категория различий, которые следует игнорировать при распознавании лиц, это: поза, освещение и выражение лица.

Общий подход к игнорированию не относящихся к делу различий называется нормализацией , которая пытается применить различные операции и преобразовывает входное изображение для получения «канонического» или «предварительно обработанного» изображения, которое, в свою очередь, может использоваться для идентификации.

Второй подход состоит в извлечении функции из образов, которые высокообогащенные инвариантны от несущественных факторов.

Качество изображения лица зависит от устройства захвата и окружающей среды, в которой оно было снято. Когда изображение лица снято без взаимодействия с объектом (например, с камеры видеонаблюдения), плохое качество изображения является неизбежным следствием и должно быть исправлено программным обеспечением, чтобы не препятствовать идентификации.

При совместном захвате компьютерная мера качества изображения хороша: оператор может быть уведомлен о проблемах качества, и изображение может быть повторно взято.

Размытие также может быть примером злонамеренного вмешательства в биометрию, чтобы избежать обнаружения (наряду с окклюзией и маскировкой). Если изображение кодируется в цифровом виде, цифровой контрольной суммы и криптографической подписи достаточно, чтобы полностью решить проблему. Если размытое изображение представляется в виде физической распечатки имитатором, для отклонения таких представлений может использоваться компьютеризированная мера качества изображения лица.


Отсутствие 2D-локализуемых объектов или точек интереса в определенной части изображения лица может быть признаком преднамеренного размытия.

Тем не менее, широкая категория фальсификации цифровых изображений (опытным пользователем программного обеспечения для редактирования изображений) может быть решена только с помощью экспертизы цифровых изображений, которая сравнивает статистику пикселей с известными моделями камер.

rwong
источник
Хорошо, я посмотрю на ваши ссылки. Изображения, над которыми я работаю, являются изображениями лиц, и я пытаюсь найти метрику, которая дала бы мне хорошие результаты, когда 2 изображения лиц схожи (размытие объектов должно давать плохой результат)
lezebulon
3
@lezebulon, вам, вероятно, нужна метрика расстояния, которая настроена на контент, например, en.wikipedia.org/wiki/Eigenface
datageist