Может ли DCT использоваться для спектра магнитуды, а не DFT?

13

Из того, что я понимаю, DCT имеет половину размера ячейки как DFT того же размера N. DFT также включает в себя информацию о фазе, но часто это не требуется, когда требуется только спектр амплитуд.

  • Может ли DCT использоваться для обеспечения спектра амплитуд с удвоенной плотностью (половина интервала между ячейками) ДПФ или будет потеряна информация вне фазы?
  • Как насчет 50% перекрытия?
Иаков
источник
4
Я считаю, что DCT также включает информацию о фазе, просто не использует комплексные числа. «Реальное БПФ» также использует половину памяти и половину времени вычислений для той же информации, отбрасывая идентичные отрицательные частоты. «действительная часть БПФ двойной длины такая же, как и ДКП, за исключением сдвига фазы половинной выборки в синусоидальных базисных функциях»
эндолит
Действительно, как минимум знак коэффициента можно рассматривать как фазу бедняка
Лоран Дюваль

Ответы:

3

Да, DCT может использоваться для обеспечения спектра величины с удвоенной плотностью. Я не совсем понимаю наложение, но я предполагаю, что, поскольку DCT покрывает меньше, вы думали, что будет наложение. Чтобы дать правильный ответ на вопрос, позвольте мне сделать краткий обзор использования DCT в основном при обработке изображений.

Во-первых, нам нужно сделать некоторые предположения. Чтобы использовать DCT, вам нужен реальный сигнал. Это по определению. В то время как вы говорите, DCT имеет половину размера ячейки по сравнению с DFT в размере N, вы предполагаете, что сигнал является низкочастотным сигналом. Иначе не так уж и много.

Для использования DCT в сжатии, поскольку ДПФ изображения будет симметричным, он создает избыточную информацию (достаточно одного бокового зеркала для воспроизведения сигнала). Следовательно, ядро ​​DCT используется для получения более плотной информации по сравнению с DFT. Это также верно для низкочастотных аудиосигналов, его можно использовать таким же образом. Хотя это делает его более плотным, коэффициенты становятся больше, поскольку ядро ​​DCT покрывает обе стороны (действительную и мнимую части) сигнала.

Моя основная задача - обработка изображений, поэтому я попытался отобразить концепции и объяснения DCT и DFT при обработке изображений. Однако одним из различий между изображением и звуком могут быть размеры. При обработке изображений вы знаете размеры (строки и столбцы для БПФ и других целей обработки). Я предполагаю, что вам нужно как-то разделить вектор аудиоданных для дальнейшей обработки. Не зная данных, это может быть неприятно (я не уверен).

Вот изображение, взятое из Интернета, но я не записал его там, где я его взял, может быть википедия .;

Обработка изображений

Как видите, преобразованное изображение представлено в DCT по амплитуде спектра без проблем. В более компактном и плотном виде, и посмотрите на величину коэффициентов. Это больше, чем в два раза DFT. DFT симметричен, вы можете просто разделить его на две части. Одна часть избыточна. И еще одна вещь, DCT может хранить информацию не только половину DFT, но почти четверть DFT. Как правило, это случай преодоления DCT DFT в изображениях.

Гефест
источник
Нельзя ли разделить БПФ на четверти, потому что он избыточен как в X, так и в Y измерениях?
эндолит
Почему похоже, что БПФ содержит больше информации, а ДКП содержит больше нулей?
эндолит
Первый вопрос, я не совсем понимаю, что вы подразумеваете под размерами X и Y? Для второго вопроса, из-за разницы в их ядрах. Он не выглядит так, как будто DCT содержит больше нулей, он на самом деле содержит больше нулей, чем обычное преобразование Фурье (DFT). Это связано еще раз с их различием в их ядрах.
Гефест
Я имею в виду, что изображение является реальным сигналом, поэтому БПФ содержит избыточную информацию. Отрицательная половина БПФ - это просто зеркало положительной половины в обоих измерениях.
эндолит
0
  • Как насчет 50% перекрытия?

Из этого вопроса я понимаю, что вы думаете о выполнении локализованной, блочной обработки в виде скользящей Фурье или спектрограммы.

  • Может ли DCT использоваться для обеспечения спектра амплитуд с удвоенной плотностью (половина интервала между ячейками) ДПФ или будет потеряна информация вне фазы?

Если вы говорите о спектре величины, то, конечно, часть фазы (будь то аргумент комплексного коэффициента Фурье или знак коэффициента DCT) будет потеряна в любом случае .

Поэтому, конечно, вы можете подключить множество ядер вместо оконного преобразования Фурье внутри краткосрочной формулировки Фурье только для анализа. Различные породы DCT, их перекрывающиеся версии (LOT, MDCT), с хорошими ортогональными и оконными свойствами, могут даже быть инвертированы (синтез).

В аудио (не сложном) DCT или перекрывающихся версиях часто используются для анализа, обнаружения начала и основного тона, (слепое разделение источника), например, есть STFT, MDCT и набор инструментов Matlab с инверсией от A. Liutkus. Большое время анализ частоты инструменты (LTFAT) также обладает:

  • Быстрые TF-преобразования с линейной частотно-временной шкалой: Габор (STFT), Уилсон и оконный MDCT
  • Разреженная регрессия в области Габора и WMDCT

Я не очень хорошо знаю аудио. Тем не менее, 50% или 75% перекрытия очень распространены, и очень немногие люди используют другие настройки. Тем не менее, очень часто используют по меньшей мере два размера окна , длинный из стационарной части, короткий для переходного, чтобы помочь преодолеть «временное» частотное ограничение «одного окна».

Лоран Дюваль
источник