Из того, что я понимаю, DCT имеет половину размера ячейки как DFT того же размера N. DFT также включает в себя информацию о фазе, но часто это не требуется, когда требуется только спектр амплитуд.
- Может ли DCT использоваться для обеспечения спектра амплитуд с удвоенной плотностью (половина интервала между ячейками) ДПФ или будет потеряна информация вне фазы?
- Как насчет 50% перекрытия?
Ответы:
Да, DCT может использоваться для обеспечения спектра величины с удвоенной плотностью. Я не совсем понимаю наложение, но я предполагаю, что, поскольку DCT покрывает меньше, вы думали, что будет наложение. Чтобы дать правильный ответ на вопрос, позвольте мне сделать краткий обзор использования DCT в основном при обработке изображений.
Во-первых, нам нужно сделать некоторые предположения. Чтобы использовать DCT, вам нужен реальный сигнал. Это по определению. В то время как вы говорите, DCT имеет половину размера ячейки по сравнению с DFT в размере N, вы предполагаете, что сигнал является низкочастотным сигналом. Иначе не так уж и много.
Для использования DCT в сжатии, поскольку ДПФ изображения будет симметричным, он создает избыточную информацию (достаточно одного бокового зеркала для воспроизведения сигнала). Следовательно, ядро DCT используется для получения более плотной информации по сравнению с DFT. Это также верно для низкочастотных аудиосигналов, его можно использовать таким же образом. Хотя это делает его более плотным, коэффициенты становятся больше, поскольку ядро DCT покрывает обе стороны (действительную и мнимую части) сигнала.
Моя основная задача - обработка изображений, поэтому я попытался отобразить концепции и объяснения DCT и DFT при обработке изображений. Однако одним из различий между изображением и звуком могут быть размеры. При обработке изображений вы знаете размеры (строки и столбцы для БПФ и других целей обработки). Я предполагаю, что вам нужно как-то разделить вектор аудиоданных для дальнейшей обработки. Не зная данных, это может быть неприятно (я не уверен).
Вот изображение, взятое из Интернета, но я не записал его там, где я его взял, может быть википедия .;
Как видите, преобразованное изображение представлено в DCT по амплитуде спектра без проблем. В более компактном и плотном виде, и посмотрите на величину коэффициентов. Это больше, чем в два раза DFT. DFT симметричен, вы можете просто разделить его на две части. Одна часть избыточна. И еще одна вещь, DCT может хранить информацию не только половину DFT, но почти четверть DFT. Как правило, это случай преодоления DCT DFT в изображениях.
источник
Из этого вопроса я понимаю, что вы думаете о выполнении локализованной, блочной обработки в виде скользящей Фурье или спектрограммы.
Если вы говорите о спектре величины, то, конечно, часть фазы (будь то аргумент комплексного коэффициента Фурье или знак коэффициента DCT) будет потеряна в любом случае .
Поэтому, конечно, вы можете подключить множество ядер вместо оконного преобразования Фурье внутри краткосрочной формулировки Фурье только для анализа. Различные породы DCT, их перекрывающиеся версии (LOT, MDCT), с хорошими ортогональными и оконными свойствами, могут даже быть инвертированы (синтез).
В аудио (не сложном) DCT или перекрывающихся версиях часто используются для анализа, обнаружения начала и основного тона, (слепое разделение источника), например, есть STFT, MDCT и набор инструментов Matlab с инверсией от A. Liutkus. Большое время анализ частоты инструменты (LTFAT) также обладает:
Я не очень хорошо знаю аудио. Тем не менее, 50% или 75% перекрытия очень распространены, и очень немногие люди используют другие настройки. Тем не менее, очень часто используют по меньшей мере два размера окна , длинный из стационарной части, короткий для переходного, чтобы помочь преодолеть «временное» частотное ограничение «одного окна».
источник