Я пытаюсь больше узнать о сжатии изображений, используя метод вейвлет-преобразования. У меня вопрос: что в определенных вейвлетах делает их предпочтительными при сжатии изображений? Их легче вычислить? Они производят более гладкие изображения? Так далее...
Пример: JPEG 2000 использует вейвлет Cohen-Daubechies-Feauveau 9/7 ... почему этот?
image-processing
wavelet
user807566
источник
источник
Ответы:
обзор
Краткий ответ: у них есть максимальное количество
vanishing moments
для данногоsupport
(то есть количество коэффициентов фильтра). Это «экстремальное» свойство, которое отличает вейвлеты Добеши в целом. Грубо говоря, больше исчезающих моментов подразумевает лучшее сжатие, а меньшая поддержка - меньше вычислений. На самом деле, компромисс между исчезающими моментами и размером фильтра настолько важен, что он доминирует в способе именования вейвлетов. Например, вы часто будете видетьD4
вейвлет, называемыйD4
илиdb2
.4
Относится к числу коэффициентов, и2
относится к числу исчезающих моментов. Оба ссылаются на один и тот же математический объект. Ниже я объясню больше о том, что такое моменты (и почему мы хотим, чтобы они исчезли), но сейчас просто поймите, что это относится к тому, насколько хорошо мы можем «свернуть» большую часть информации в сигнале в меньшую количество значений. Сжатие с потерями достигается сохранением этих значений и отбрасыванием остальных.Теперь вы, возможно, заметили
CDF 9/7
, что в имени используетсяJPEG 2000
два числа в имени, а не один. На самом деле, это также упоминается какbior 4.4
. Это потому, что это не «стандартный» дискретный вейвлет вообще. На самом деле, он даже технически не сохраняет энергию в сигнале, и это свойство - единственная причина, по которой люди так воодушевились DWT! Числа,9/7
и4.4
, по-прежнему относятся к опорам и исчезающим моментам соответственно, но теперь есть два набора коэффициентов, которые определяют вейвлет. Технический термин - это тоorthogonal
, что они естьbiorthogonal
. Вместо того, чтобы углубляться в то, что это значит математически, яJPEG 2000
Более подробное обсуждение проектных решений, связанных с вейвлетом CDF 9/7, можно найти в следующей статье:
Я просто рассмотрю основные моменты здесь.
Довольно часто ортогональные вейвлеты Добеши могут фактически привести к увеличению числа значений, требуемых для представления сигнала. Эффект называется
coefficient expansion
. Если мы делаем сжатие с потерями, это может иметь или не иметь значения (так как мы в любом случае отбрасываем значения в конце), но оно определенно кажется контрпродуктивным в контексте сжатия. Одним из способов решения этой проблемы является обработка входного сигнала как периодического.Простая обработка входных данных как периодических приводит к разрывам на краях, которые сложнее сжимать, и являются просто артефактами преобразования. Например, рассмотрим переходы от 3 до 0 в следующем периодическом расширении: . Чтобы решить эту проблему, мы можем использовать симметричное периодическое расширение сигнала следующим образом: . Устранение скачков по краям является одной из причин, по которой дискретное косинусное преобразование (DCT) используется вместо DFT в JPEG. Представление сигнала косинусами неявно предполагает «зацикливание фронта» входного сигнала, поэтому нам нужны вейвлеты, которые имеют одинаковое свойство симметрии.[ 0 , 1 , 2 , 3 ] → [ . , , , 0 , 1 , 2 , 3 , 3 , 2 , 1[ 0 , 1 , 2 , 3 ] → [ . , 0,0 , 1 , 2 , 3 , 0 , 1 , 2 , 3 , . , , ] [ 0 , 1 , 2 , 3 ] → [ . , , , 0 , 1 , 2 , 3 , 3 , 2 , 1 , 0 , 0 , 1 ... ]
К сожалению, единственным ортогональным вейвлетом, который обладает требуемыми характеристиками, является вейвлет Хаара (или D2, db1), который является только одним исчезающим моментом. Тьфу. Это приводит нас к биортогональным вейвлетам, которые на самом деле являются избыточными представлениями и поэтому не сохраняют энергию. Причина, по которой вейвлеты CDF 9/7 используются на практике, заключается в том, что они были разработаны так, чтобы максимально приблизить энергосбережение. Они также хорошо зарекомендовали себя на практике.
Существуют и другие способы решения различных проблем (кратко упомянутых в статье), но это общие штрихи задействованных факторов.
Моменты исчезновения
Итак, что такое моменты, и почему мы заботимся о них? Гладкие сигналы могут быть хорошо аппроксимированы полиномами, то есть функциями вида:
Моменты функции (то есть сигнала) являются мерой того, насколько она похожа на данную степень x. Математически это выражается как внутреннее произведение между функцией и степенью х. Исчезающий момент означает, что внутреннее произведение равно нулю, и, следовательно, функция не «напоминает» эту степень x следующим образом (для непрерывного случая):
Теперь каждый дискретный ортогональный вейвлет имеет два связанных с ним КИХ-фильтра , которые используются в DWT . Один - это фильтр нижних частот (или масштабирующий) , а другой - фильтр верхних частот (или вейвлет)ψφ ψ , Эта терминология, кажется, несколько отличается, но это то, что я буду использовать здесь. На каждой ступени DWT фильтр верхних частот используется для «отделения» слоя детализации, а фильтр нижних частот дает сглаженную версию сигнала без этой детализации. Если фильтр верхних частот имеет исчезающие моменты, эти моменты (т. Е. Полиномиальные характеристики низкого порядка) будут вставлены в дополнительный сглаженный сигнал, а не в детальный сигнал. В случае сжатия с потерями, мы надеемся, что детальный сигнал не будет содержать много информации, и поэтому мы можем выбросить большую его часть.
Вот простой пример использования вейвлета Хаара (D2). Обычно используется коэффициент масштабирования , но я опускаю его здесь, чтобы проиллюстрировать концепцию. Два фильтра следующие: ϕ=[1,1]1 / 2-√
Фильтр верхних частот исчезает в нулевой момент, т. Е. , поэтому он имеет один исчезающий момент. Чтобы увидеть это, рассмотрим этот постоянный сигнал: . Теперь интуитивно должно быть очевидно, что там не так много информации (или какого-либо постоянного сигнала). Мы могли бы описать то же самое, сказав «четыре пары». DWT дает нам возможность описать эту интуицию в явном виде. Вот что происходит за один проход DWT с использованием вейвлета Хаара:[ 2 , 2 , 2 , 2 ]Икс0= 1 [ 2 , 2 , 2 , 2 ]
И что происходит на втором проходе, который работает только на сглаженном сигнале:
Обратите внимание на то, что постоянный сигнал полностью невидим для проходов деталей (все они оказываются равными 0). Также обратите внимание, как четыре значения были уменьшены до одного значения . Теперь, если мы хотим передать исходный сигнал, мы можем просто отправить , и обратный DWT может восстановить исходный сигнал, предполагая, что все коэффициенты детализации равны нулю. Вейвлеты с исчезающими моментами более высокого порядка позволяют получить аналогичные результаты с сигналами, которые хорошо аппроксимируются линиями, параболами, кубиками и т. Д.8 82 8 8
Дальнейшее чтение
Я придаю большое значение деталям, чтобы описанное выше лечение было доступно. Следующая статья имеет гораздо более глубокий анализ:
сноска
Вышеупомянутая статья, кажется, предполагает, что вейвлет JPEG2000 называется Daubechies 9/7 и отличается от вейвлета CDF 9/7.
Черновик стандарта JPEG2000 ( ссылка в формате pdf ), который я просмотрел, также называет официальный фильтр Добеши 9/7. Это ссылается на эту статью:
Я не читал ни одного из этих источников, поэтому я не могу точно сказать, почему Википедия называет вейвлет JPEG2000 CDF 9/7. Кажется, что между ними может быть разница, но люди все равно называют официальный вейвлет JPEG2000 CDF 9/7 (потому что он основан на том же фундаменте?). Независимо от названия, статья Usvitch описывает ту, которая используется в стандарте.
источник
Качество преобразования сигнала оценивается по двум разным показателям: сжатие, а в случае сжатия с потерями - качество. Сжатие определяется сжатием энергии, но качество сложнее.
Традиционно качество измеряется среднеквадратичной ошибкой или средним для каждого пикселя SNR. Тем не менее, люди не склонны оценивать сигналы с MSE или SNR. Люди очень чувствительны к структурированному шуму, где MSE, как правило, не существует. Разработка алгоритмов, которые обеспечивают человеческие метрики качества, является активной областью исследований. Индекс структурной SIMilarity (SSIM) Бовика - хорошее место для начала.
источник
В качестве очень короткого ответа - любое преобразование лучше, чем другое преобразование, если оно имеет то, что известно как «свойство уплотнения энергии», которое объясняется следующим образом:
«когда только небольшая часть коэффициентов преобразования имеет большую величину, так что сохранение лишь нескольких коэффициентов и отбрасывание или квантизация других по-прежнему позволяют перестройку почти идеальна». Такое свойство связано с возможностью декорреляции унитарных преобразований ".
Преобразование с меньшей степенью уплотнения энергии - это то, которое потребует наименьшего количества символов и, следовательно, меньших битов.
Преобразование с наивысшим свойством уплотнения энергии - DCT.
Dipan.
источник
Естественные изображения состоят из различных функций изображения, мы можем широко классифицировать их на плавные или медленно меняющиеся объекты, текстуры и края. Хороший метод сжатия - это метод, который преобразует изображение в область, где вся энергия сигнала сохраняется в виде нескольких коэффициентов.
Преобразование Фурье пытается приблизить изображение, используя синусы и косинусы. Теперь синусы и косинусы могут довольно кратко аппроксимировать гладкие сигналы, но, как известно, плохо подходят для аппроксимации разрывов. Если вы знакомы с феноменом Гиббса, вы будете знать, что нужно большое количество коэффициентов Фурье, чтобы избежать артефактов аппроксимации разрыва во времени. Однако чем меньше число коэффициентов, тем лучше сжатие. Следовательно, существует неотъемлемый компромисс между количеством коэффициентов и потерями в методе сжатия, который мы обычно называем компромиссом скорость-искажение.
Однако у нас пока нет единого базиса или преобразования, которые могли бы аппроксимировать гладкие объекты, точечные особенности, ребра и текстуры.
источник
DCT обладает очень хорошим уплотнением энергии для множества общих сигналов, и он также довольно хорошо согласуется с тем, как работает дифракция (основной физический процесс в визуализации), поскольку дифракция может быть представлена в виде ядра Фурье. Это дает ему много преимуществ.
Проблема состоит в том, что коэффициенты DCT обязательно делокализованы по всей области преобразования. Это требует, чтобы было создано много небольших областей (блоков) преобразования, чтобы энергия в одной области не переходила в другую при преобразовании. Это ограничивает способность преобразования к компактной энергии, а также вводит артефакты на многих границах блоков.
Я мало сделал с вейвлетами, поэтому могу ошибаться, но они более делокализованы, с разными коэффициентами, представляющими разные компромиссы между областью и частотой. Это позволяет использовать блоки большего размера с меньшим количеством артефактов. Не уверенный на практике, сколько различий, которые действительно делают, хотя.
источник
Говоря о лучших вейвлетах, мы должны учитывать, что сзади имеется один и тот же кодер: производительность преобразования сильно переплетается с квантованием и кодированием. Производительность обычно такова: лучшее сжатие для того же качества или лучшее качество для того же сжатия. Сжатие - это простая мера, а качество - нет. Но предположим, у нас есть один.
Наконец, это зависит от класса изображений, которые вы хотите сжать: универсальные или сфокусированные, как с медицинскими изображениями, или сжатие сейсмических данных, с ограниченными, конкретными типами данных? Здесь снова, вейвлеты могут быть разными.
Теперь, каковы основные морфологические компоненты изображений и как с ними работают вейвлеты:
Таким образом, с точки зрения анализа, лучшие вейвлеты - это хорошее сочетание всех вышеперечисленных функций в целом. На стороне синтеза лучшие вейвлеты смягчают эффекты сжатия, например квантование, чтобы придать приятный аспект. Свойства, требуемые при анализе / синтезе, немного отличаются, поэтому биортогональные вейвлеты хороши: вы можете разделить свойства анализа (исчезающие моменты) / синтеза (гладкости), которые вы не можете сделать с ортогональными, и спровоцировать увеличение длины фильтра , весьма вредно для вычислительной производительности. Дополнительные биортогональные вейвлеты могут быть симметричными, хорошими для ребер.
Наконец, вы хотите сжатие без потерь? Затем вам понадобятся целочисленные вейвлеты (или сгустки).
И все вышеперечисленное смешивается с вычислительными проблемами: разделяемые вейвлеты, не слишком длинные. И процесс стандартизации в комитете JPEG.
Наконец, 5/3 достаточно хорош для без потерь, достаточно короткий. Некоторые из 9/7 тоже хороши. Гораздо лучше, чем вейвлет 13/7 ? Не совсем, и даже если это в PSNR, не самое лучшее качество изображения.
Таким образом, лучшие вейвлеты находятся в шаговой доступности, для традиционных изображений и личного общения с авторами
Заставь меня поверить, что «лучший» аспект 9/7 не полностью объяснен и не гарантирован.
источник