Какие свойства делают некоторые вейвлеты «лучше», чем другие при сжатии изображений?

40

Я пытаюсь больше узнать о сжатии изображений, используя метод вейвлет-преобразования. У меня вопрос: что в определенных вейвлетах делает их предпочтительными при сжатии изображений? Их легче вычислить? Они производят более гладкие изображения? Так далее...

Пример: JPEG 2000 использует вейвлет Cohen-Daubechies-Feauveau 9/7 ... почему этот?

user807566
источник
Насколько я знаю, вейвлет Daubechies обеспечивает гладкую основу, поэтому сильно сжатые изображения «размыты». Например, вейвлет Хаара может создавать блочные артефакты. Поскольку вы упомянули JPEG 2000, я хотел бы отметить, что также схема кодирования ненулевых вейвлет-коэффициентов влияет на декодированные изображения (EZW, SPIHT, ...).
Либор
На ваш вопрос ответили. Не стесняйтесь голосовать за полезных и принимайте самых подходящих
Лоран Дюваль

Ответы:

27

обзор

Краткий ответ: у них есть максимальное количество vanishing momentsдля данного support(то есть количество коэффициентов фильтра). Это «экстремальное» свойство, которое отличает вейвлеты Добеши в целом. Грубо говоря, больше исчезающих моментов подразумевает лучшее сжатие, а меньшая поддержка - меньше вычислений. На самом деле, компромисс между исчезающими моментами и размером фильтра настолько важен, что он доминирует в способе именования вейвлетов. Например, вы часто будете видеть D4вейвлет, называемый D4или db2. 4Относится к числу коэффициентов, и2относится к числу исчезающих моментов. Оба ссылаются на один и тот же математический объект. Ниже я объясню больше о том, что такое моменты (и почему мы хотим, чтобы они исчезли), но сейчас просто поймите, что это относится к тому, насколько хорошо мы можем «свернуть» большую часть информации в сигнале в меньшую количество значений. Сжатие с потерями достигается сохранением этих значений и отбрасыванием остальных.

Теперь вы, возможно, заметили CDF 9/7, что в имени используется JPEG 2000два числа в имени, а не один. На самом деле, это также упоминается как bior 4.4. Это потому, что это не «стандартный» дискретный вейвлет вообще. На самом деле, он даже технически не сохраняет энергию в сигнале, и это свойство - единственная причина, по которой люди так воодушевились DWT! Числа, 9/7и 4.4, по-прежнему относятся к опорам и исчезающим моментам соответственно, но теперь есть два набора коэффициентов, которые определяют вейвлет. Технический термин - это то orthogonal, что они есть biorthogonal. Вместо того, чтобы углубляться в то, что это значит математически, я

JPEG 2000

Более подробное обсуждение проектных решений, связанных с вейвлетом CDF 9/7, можно найти в следующей статье:

Усевич, Брайан Э. Учебник по современному сжатию вейвлет-изображений с потерями: основы JPEG 2000 .

Я просто рассмотрю основные моменты здесь.

  1. Довольно часто ортогональные вейвлеты Добеши могут фактически привести к увеличению числа значений, требуемых для представления сигнала. Эффект называется coefficient expansion. Если мы делаем сжатие с потерями, это может иметь или не иметь значения (так как мы в любом случае отбрасываем значения в конце), но оно определенно кажется контрпродуктивным в контексте сжатия. Одним из способов решения этой проблемы является обработка входного сигнала как периодического.

  2. Простая обработка входных данных как периодических приводит к разрывам на краях, которые сложнее сжимать, и являются просто артефактами преобразования. Например, рассмотрим переходы от 3 до 0 в следующем периодическом расширении: . Чтобы решить эту проблему, мы можем использовать симметричное периодическое расширение сигнала следующим образом: . Устранение скачков по краям является одной из причин, по которой дискретное косинусное преобразование (DCT) используется вместо DFT в JPEG. Представление сигнала косинусами неявно предполагает «зацикливание фронта» входного сигнала, поэтому нам нужны вейвлеты, которые имеют одинаковое свойство симметрии.[ 0 , 1 , 2 , 3 ] [ . , , , 0 , 1 , 2 , 3 , 3 , 2 , 1[0,1,2,3][,,+0,0,1,2,3,0,1,2,3,,,,][0,1,2,3][,,,,0,1,2,3,3,2,1,0,0,1 ...]

  3. К сожалению, единственным ортогональным вейвлетом, который обладает требуемыми характеристиками, является вейвлет Хаара (или D2, db1), который является только одним исчезающим моментом. Тьфу. Это приводит нас к биортогональным вейвлетам, которые на самом деле являются избыточными представлениями и поэтому не сохраняют энергию. Причина, по которой вейвлеты CDF 9/7 используются на практике, заключается в том, что они были разработаны так, чтобы максимально приблизить энергосбережение. Они также хорошо зарекомендовали себя на практике.

Существуют и другие способы решения различных проблем (кратко упомянутых в статье), но это общие штрихи задействованных факторов.

Моменты исчезновения

Итак, что такое моменты, и почему мы заботимся о них? Гладкие сигналы могут быть хорошо аппроксимированы полиномами, то есть функциями вида:

a+бИкс+сИкс2+dИкс3+,,,

Моменты функции (то есть сигнала) являются мерой того, насколько она похожа на данную степень x. Математически это выражается как внутреннее произведение между функцией и степенью х. Исчезающий момент означает, что внутреннее произведение равно нулю, и, следовательно, функция не «напоминает» эту степень x следующим образом (для непрерывного случая):

ИксNе(Икс)dИксзнак равно0

Теперь каждый дискретный ортогональный вейвлет имеет два связанных с ним КИХ-фильтра , которые используются в DWT . Один - это фильтр нижних частот (или масштабирующий) , а другой - фильтр верхних частот (или вейвлет)ψφψ, Эта терминология, кажется, несколько отличается, но это то, что я буду использовать здесь. На каждой ступени DWT фильтр верхних частот используется для «отделения» слоя детализации, а фильтр нижних частот дает сглаженную версию сигнала без этой детализации. Если фильтр верхних частот имеет исчезающие моменты, эти моменты (т. Е. Полиномиальные характеристики низкого порядка) будут вставлены в дополнительный сглаженный сигнал, а не в детальный сигнал. В случае сжатия с потерями, мы надеемся, что детальный сигнал не будет содержать много информации, и поэтому мы можем выбросить большую его часть.

Вот простой пример использования вейвлета Хаара (D2). Обычно используется коэффициент масштабирования , но я опускаю его здесь, чтобы проиллюстрировать концепцию. Два фильтра следующие: ϕ=[1,1]1/2

φзнак равно[1,1]ψзнак равно[1,-1]

Фильтр верхних частот исчезает в нулевой момент, т. Е. , поэтому он имеет один исчезающий момент. Чтобы увидеть это, рассмотрим этот постоянный сигнал: . Теперь интуитивно должно быть очевидно, что там не так много информации (или какого-либо постоянного сигнала). Мы могли бы описать то же самое, сказав «четыре пары». DWT дает нам возможность описать эту интуицию в явном виде. Вот что происходит за один проход DWT с использованием вейвлета Хаара:[ 2 , 2 , 2 , 2 ]Икс0знак равно1[2,2,2,2]

[2,2,2,2]ψφ{[2+2,2+2]знак равно[4,4][2-2,2-2]знак равно[0,0]

И что происходит на втором проходе, который работает только на сглаженном сигнале:

[4,4]ψφ{[4+4]знак равно[8][4-4]знак равно[0]

Обратите внимание на то, что постоянный сигнал полностью невидим для проходов деталей (все они оказываются равными 0). Также обратите внимание, как четыре значения были уменьшены до одного значения . Теперь, если мы хотим передать исходный сигнал, мы можем просто отправить , и обратный DWT может восстановить исходный сигнал, предполагая, что все коэффициенты детализации равны нулю. Вейвлеты с исчезающими моментами более высокого порядка позволяют получить аналогичные результаты с сигналами, которые хорошо аппроксимируются линиями, параболами, кубиками и т. Д.8 8288

Дальнейшее чтение

Я придаю большое значение деталям, чтобы описанное выше лечение было доступно. Следующая статья имеет гораздо более глубокий анализ:

М. Unser и Т. Blu, Математические свойства вейвлет-фильтров JPEG2000 , IEEE Trans. Image Proc., Vol. 12, нет 9 сентября 2003, стр.1080-1090.

сноска

Вышеупомянутая статья, кажется, предполагает, что вейвлет JPEG2000 называется Daubechies 9/7 и отличается от вейвлета CDF 9/7.

Мы получили точную форму фильтров масштабирования Daubechies 9/7 JPEG2000 ... Эти фильтры являются результатом факторизации того же полинома, что и [10]. Основное отличие состоит в том, что фильтры 9/7 симметричны. Более того, в отличие от биортогональных сплайнов Коэна-Добеши-Фово [11], нерегулярная часть многочлена была разделена между обеими сторонами и как можно более равномерно.DaUбесчасяеs8

[11] A. Cohen, I. Daubechies, JC Feauveau, “Биортогональные базисы вейвлетов с компактным носителем”, Comm. Чистое приложение Math., Vol. 45, нет 5, с. 485–560, 1992.

Черновик стандарта JPEG2000 ( ссылка в формате pdf ), который я просмотрел, также называет официальный фильтр Добеши 9/7. Это ссылается на эту статью:

М. Антонини, М. Барло, П. Матье и И. Добеши, «Кодирование изображений с использованием вейвлет-преобразования», IEEE Trans. Image Proc. 1, с. 205-220, апрель 1992 г.

Я не читал ни одного из этих источников, поэтому я не могу точно сказать, почему Википедия называет вейвлет JPEG2000 CDF 9/7. Кажется, что между ними может быть разница, но люди все равно называют официальный вейвлет JPEG2000 CDF 9/7 (потому что он основан на том же фундаменте?). Независимо от названия, статья Usvitch описывает ту, которая используется в стандарте.

специалист по обработке данных
источник
@datageist Фантастический ответ! Кроме того, еще одна причина, по которой 9/7 возникла в первую очередь, заключалась в том, что это был альтернативный способ разложения полинома реконструкции с ограничением на то, чтобы фильтры были симметричными . Таким образом, фазовый отклик остается линейным. (Напротив, вейвлет daub4, в то время как FIR, является асимметричным и индуцирует нелинейные фазы в обработанном сигнале). 9/7 использовался в JPEG из-за субъективной склонности к тому, чтобы мы любили линейные и нелинейные искажения в изображениях.
Спейси
1
Хорошая статья. Информация в статье в википедии соответствует цитируемым источникам, по сути, Daubechies «10 лекций», поэтому она может быть устаревшей по отношению к JPEG2000. Одна поправка: биортогональность не избыточна. Условия биортогональности накладывают в точности обратные банки фильтров. Избыточные преобразования начинаются с фреймлетов.
Доктор Лутц Леманн
10

Качество преобразования сигнала оценивается по двум разным показателям: сжатие, а в случае сжатия с потерями - качество. Сжатие определяется сжатием энергии, но качество сложнее.

Традиционно качество измеряется среднеквадратичной ошибкой или средним для каждого пикселя SNR. Тем не менее, люди не склонны оценивать сигналы с MSE или SNR. Люди очень чувствительны к структурированному шуму, где MSE, как правило, не существует. Разработка алгоритмов, которые обеспечивают человеческие метрики качества, является активной областью исследований. Индекс структурной SIMilarity (SSIM) Бовика - хорошее место для начала.

totowtwo
источник
6

В качестве очень короткого ответа - любое преобразование лучше, чем другое преобразование, если оно имеет то, что известно как «свойство уплотнения энергии», которое объясняется следующим образом:

«когда только небольшая часть коэффициентов преобразования имеет большую величину, так что сохранение лишь нескольких коэффициентов и отбрасывание или квантизация других по-прежнему позволяют перестройку почти идеальна». Такое свойство связано с возможностью декорреляции унитарных преобразований ".

Преобразование с меньшей степенью уплотнения энергии - это то, которое потребует наименьшего количества символов и, следовательно, меньших битов.

Преобразование с наивысшим свойством уплотнения энергии - DCT.

Dipan.

Дипан Мехта
источник
1
DCT имеет самое высокое уплотнение энергии для неизвестных классов сигналов. Если вы можете охарактеризовать свой домен сигнала, вы можете сделать лучше.
totowtwo
Я согласен @totowtwo. Моя точка зрения заключается в том, что «свойство компактности энергии» - это то, что делает определенное преобразование тем, что делает его предпочтительным для механизмов кодеков.
Дипан Мехта
5

Естественные изображения состоят из различных функций изображения, мы можем широко классифицировать их на плавные или медленно меняющиеся объекты, текстуры и края. Хороший метод сжатия - это метод, который преобразует изображение в область, где вся энергия сигнала сохраняется в виде нескольких коэффициентов.

Преобразование Фурье пытается приблизить изображение, используя синусы и косинусы. Теперь синусы и косинусы могут довольно кратко аппроксимировать гладкие сигналы, но, как известно, плохо подходят для аппроксимации разрывов. Если вы знакомы с феноменом Гиббса, вы будете знать, что нужно большое количество коэффициентов Фурье, чтобы избежать артефактов аппроксимации разрыва во времени. Однако чем меньше число коэффициентов, тем лучше сжатие. Следовательно, существует неотъемлемый компромисс между количеством коэффициентов и потерями в методе сжатия, который мы обычно называем компромиссом скорость-искажение.

К-2/3К-1соответственно. При одинаковом числе членов ошибка уменьшается быстрее для вейвлетов. Это означает, что вейвлеты имеют лучшее сжатие энергии, когда изображения не идеально гладкие (медленно меняющиеся) и содержат особенности.

Однако у нас пока нет единого базиса или преобразования, которые могли бы аппроксимировать гладкие объекты, точечные особенности, ребра и текстуры.

user3303
источник
4

DCT обладает очень хорошим уплотнением энергии для множества общих сигналов, и он также довольно хорошо согласуется с тем, как работает дифракция (основной физический процесс в визуализации), поскольку дифракция может быть представлена ​​в виде ядра Фурье. Это дает ему много преимуществ.

Проблема состоит в том, что коэффициенты DCT обязательно делокализованы по всей области преобразования. Это требует, чтобы было создано много небольших областей (блоков) преобразования, чтобы энергия в одной области не переходила в другую при преобразовании. Это ограничивает способность преобразования к компактной энергии, а также вводит артефакты на многих границах блоков.

Я мало сделал с вейвлетами, поэтому могу ошибаться, но они более делокализованы, с разными коэффициентами, представляющими разные компромиссы между областью и частотой. Это позволяет использовать блоки большего размера с меньшим количеством артефактов. Не уверенный на практике, сколько различий, которые действительно делают, хотя.

Saratoga
источник
0

Говоря о лучших вейвлетах, мы должны учитывать, что сзади имеется один и тот же кодер: производительность преобразования сильно переплетается с квантованием и кодированием. Производительность обычно такова: лучшее сжатие для того же качества или лучшее качество для того же сжатия. Сжатие - это простая мера, а качество - нет. Но предположим, у нас есть один.

×124×4

Наконец, это зависит от класса изображений, которые вы хотите сжать: универсальные или сфокусированные, как с медицинскими изображениями, или сжатие сейсмических данных, с ограниченными, конкретными типами данных? Здесь снова, вейвлеты могут быть разными.

Теперь, каковы основные морфологические компоненты изображений и как с ними работают вейвлеты:

  • медленные тренды, развивающиеся фоны: исчезающие моменты, которые избавляются от полиномов в вейвлет-подзонах,
  • неровности: хорошо с функциями масштабирования,
  • ребра: пойман производным аспектом вейвлетов,
  • текстуры: колебания, захваченные колеблющимся аспектом вейвлетов,
  • остальное, что шумно, немоделировано: управляется ортогональностью (или близко).

Таким образом, с точки зрения анализа, лучшие вейвлеты - это хорошее сочетание всех вышеперечисленных функций в целом. На стороне синтеза лучшие вейвлеты смягчают эффекты сжатия, например квантование, чтобы придать приятный аспект. Свойства, требуемые при анализе / синтезе, немного отличаются, поэтому биортогональные вейвлеты хороши: вы можете разделить свойства анализа (исчезающие моменты) / синтеза (гладкости), которые вы не можете сделать с ортогональными, и спровоцировать увеличение длины фильтра , весьма вредно для вычислительной производительности. Дополнительные биортогональные вейвлеты могут быть симметричными, хорошими для ребер.

Наконец, вы хотите сжатие без потерь? Затем вам понадобятся целочисленные вейвлеты (или сгустки).

И все вышеперечисленное смешивается с вычислительными проблемами: разделяемые вейвлеты, не слишком длинные. И процесс стандартизации в комитете JPEG.

Наконец, 5/3 достаточно хорош для без потерь, достаточно короткий. Некоторые из 9/7 тоже хороши. Гораздо лучше, чем вейвлет 13/7 ? Не совсем, и даже если это в PSNR, не самое лучшее качество изображения.

Таким образом, лучшие вейвлеты находятся в шаговой доступности, для традиционных изображений и личного общения с авторами

М. Unser и Т. Blu, Математические свойства вейвлет-фильтров JPEG2000 , IEEE Trans. Image Proc., Vol. 12, нет 9 сентября 2003, стр.1080-1090.

Заставь меня поверить, что «лучший» аспект 9/7 не полностью объяснен и не гарантирован.

M

Лоран Дюваль
источник