Все обычные непрямоугольные оконные функции кажутся симметричными. Есть ли когда-нибудь случай, когда кто-то захочет использовать несимметричную оконную функцию перед БПФ? (Скажите, если данные на одной стороне апертуры БПФ считались немного более важными, чем данные на другой, или менее шумными и т. Д.)
Если да, то какие виды асимметричных оконных функций были изучены и как они влияют на частотную характеристику по сравнению с симметричным окном со смещением (с большими потерями?)?
fft
fourier-transform
window-functions
hotpaw2
источник
источник
Ответы:
Я буду использовать сокращенное окно для «оконной функции».
Со звуком любая обработка, которая создает что-то похожее на предварительный звонок или предварительное эхо, будет звучать неряшливо, как mp3 с низкой скоростью передачи. Это происходит, когда локализованная энергия переходного процесса или импульса распространяется во времени назад, например, путем модификации спектральных данных в перекрывающихся преобразованиях, таких как перекрывающееся модифицированное дискретное косинусное преобразование (MDCT). При такой обработке аудио обрабатывается окнами с перекрывающимися окнами анализа , преобразуется, обрабатывается в частотной области (например, данные сжимаются до меньшего битрейта), снова отображается в окне синтеза и суммируется обратно вместе. Продукт окна анализа и синтеза должен быть таким, чтобы перекрывающиеся окна сводились к единице.
Традиционно используемые оконные функции были симметричными, а их ширина была компромиссом между частотной избирательностью (длинное окно) и предотвращением артефактов во временной области (короткое окно). Чем шире окно, тем больше времени назад обработка может распространить сигнал. Более свежим решением является использование асимметричного окна. Два используемых окна могут быть зеркальным отображением друг друга. Окно анализа быстро падает с пика до нуля, так что импульсы не «детектируются» заблаговременно, а окно синтеза быстро поднимается с нуля до пика, так что эффекты любой обработки не сильно распространяются во времени. Еще одним преимуществом этого является низкая задержка. Асимметричные окна могут иметь хорошую частотную избирательность и могут заменять симметричные окна переменного размера при сжатии звука, как своего рода лекарство от всех болезней. ВидетьМ. Шнелл, М. Шмидт, М. Джандер, Т. Альберт, Р. Гейгер, В. Руоппила, П. Экстранд, М. Луцки, Б. Гриль, «MPEG-4 Enhanced Low Delay AAC - новый стандарт для высоких качественная связь » , 125-я Конвенция AES, Сан-Франциско, Калифорния, США, препринт 7503, октябрь 2008 г. и другой документ для конференций, где они также показывают величину преобразования Фурье своего окна: Schnell, M., et al. 2007. Улучшенный MPEG-4 с низкой задержкой AAC - связь с низким битрейтом и высоким качеством. В 122-й конвенции AES .
Рисунок 1. Иллюстрация использования асимметричных окон в совмещенном анализе-обработке-синтезе. Произведение (черным пунктиром) окна анализа (синего цвета) и окна синтеза (желтовато-оранжевого цвета) суммируется с единицей из окна предыдущего кадра (серого цвета). Необходимы дополнительные ограничения, чтобы гарантировать идеальную реконструкцию при использовании MDCT.
Дискретное преобразование Фурье (DFT, FFT) может быть использовано вместо MDCT, но в таких случаях дает избыточные спектральные данные. По сравнению с DFT, MDCT дает только половину спектральных данных, в то же время обеспечивая идеальную реконструкцию, если выбраны подходящие окна.
Вот мой собственный асимметричный дизайн окна (рис. 2), подходящий для перекрывающегося анализа-обработки-синтеза с использованием DFT, но не MDCT, с которым он не дает идеальной реконструкции. Окно пытается минимизировать произведение среднеквадратичных значений ширины полосы времени и частоты (аналогично ограниченному окну Гаусса ), сохраняя при этом некоторые потенциально полезные свойства во временной области: неотрицательные, унимодальные с пиком в «нулевом времени», вокруг которого анализируются и синтезируются окна являются зеркальными отображениями друг друга, непрерывности функции и первой производной, среднего значения нуля, когда квадрат оконной функции интерпретируется как ненормализованная функция плотности вероятности. Окно было оптимизировано с использованием дифференциальной эволюции .
Рисунок 2. Слева: асимметричное окно анализа, подходящее для перекрывающегося анализа-обработки-повторного синтеза вместе с обратным по времени окном синтеза аналога. Справа: окно косинуса, с той же задержкой, что и у асимметричного окна
Рисунок 3. Величина преобразований Фурье окна косинуса (синего цвета) и асимметричного окна (оранжевого цвета) на рисунке 2. Несимметричное окно показывает лучшую частотную избирательность.
Вот исходный код Octave для графиков и асимметричного окна. Код для заимствования взят из Wikimedia Commons . В Linux я рекомендую установить
gnuplot
,epstool
,pstoedit
,transfig
первый иlibrsvg2-bin
для просмотра с помощьюdisplay
.Возможно, вы захотите использовать только каждый второй образец окна, потому что оно начинается и заканчивается в нуле. Следующий код C ++ делает это за вас, поэтому вы не получите никаких нулевых выборок, за исключением одной четверти окна, которая везде равна нулю. Для окна анализа это первый квартал, а для окна синтеза - последний квартал. Вторая половина окна анализа должна быть выровнена с первой половиной окна синтеза для расчета их продукта. Код также проверяет среднее значение окна (как функцию плотности вероятности) и демонстрирует плоскостность перекрывающейся реконструкции.
И исходный код функции стоимости оптимизации, которая будет использоваться с Kiss FFT и библиотекой оптимизации :
источник
Это зависит от контекста окон. Оконное управление, как оно традиционно разрабатывалось, было предназначено для метода оценки спектральной плотности мощности Блэкмана-Тьюки. Это общий вид методов коррелограмм, в которых используется теорема Винера-Хинчина с дискретным временем. Напомним, это связывает автокорреляционную последовательность со спектральной плотностью мощности через дискретное временное преобразование Фурье.
Поэтому окна были разработаны с учетом нескольких критериев. Во-первых, они должны были получить единство в начале координат. Это должно было сохранить мощность в последовательности автокорреляции сигнала, так как rxx [0] можно рассматривать как мощность выборки. Далее окно должно сужаться от начала координат. Это по ряду причин. Во-первых, чтобы быть действительной последовательностью автокорреляции, все другие лаги должны быть меньше или равны началу координат. Во-вторых, это учитывало более высокий вес более низких лагов, которые были рассчитаны с большой достоверностью с использованием большинства выборок, и небольшой или нулевой вес более высоких лагов, которые имеют увеличивающуюся дисперсию из-за уменьшения количества выборок данных, доступных для их расчет. В конечном итоге это приводит к расширению основного лепестка и, как следствие, снижению разрешения в оценке PSD,
Наконец, также желательно, чтобы окна имели неотрицательный спектр. Это связано с тем, что с помощью метода Блэкмена-Тьюки можно представить смещение окончательной оценки как истинную спектральную плотность мощности, свернутую со спектром окна. Если у этого спектра окна есть отрицательные области, возможно иметь отрицательные области в вашей оценке спектральной плотности мощности. Это, очевидно, нежелательно, так как в этом контексте имеет мало физического значения. Кроме того, вы заметите, что в методе Блэкмена-Тьюки нет операции возведения в квадрат. Это связано с тем, что при действительной и равномерной последовательности автокорреляции, умноженной на реальное и четное окно, дискретное преобразование Фурье также будет действительным и четным. На практике вы найдете очень маленькие отрицательные компоненты, которые обычно квантуется.
По этим причинам окна также имеют нечетную длину, потому что все действительные последовательности автокорреляции также. Теперь то, что еще можно сделать (и делается), - это управление окнами в контексте методов периодограммы. То есть, окно данных, а затем взять квадрат величины оконных данных. Это не эквивалентно методу Блэкмена-Тьюки. Через некоторые статистические выводы вы можете обнаружить, что они ведут себя аналогично в среднем , но не в целом. Например, для уменьшения дисперсии оценок достаточно использовать окна для каждого сегмента в методе Уэлча или Бартлетта. Таким образом, по сути, с этими методами мотивация отчасти одинакова, но различна. В этих методах мощность нормализуется, например, путем деления энергии окна вместо тщательного взвешивания оконных лагов.
Итак, мы надеемся, что это контекстуализирует окна и их происхождение, и почему они симметричны. Если вам интересно, почему можно выбрать асимметричное окно, рассмотрите последствия свойства двойственности преобразования Фурье и то, что свертка для оценки вашей спектральной плотности мощности означает для вашего приложения. Приветствия.
источник
Первоначальная задача управления окнами - убедиться, что сигнал (предполагаемый периодическим с помощью DFT) не имеет резких переходных процессов в начале по сравнению с концом. Стоимость состоит в том, что частоты к центру (симметричного) окна будут более взвешенными и представлены в последующем ДПФ.
Имея все это на заднем плане, я могу себе представить, что можно использовать асимметричное окно, чтобы подчеркнуть локальные временные особенности в сигнале, который анализируется с помощью ДПФ. Однако это может происходить за счет более широкой ширины лепестка во время ДПФ, если конечные точки вашего сигнала не имеют примерно одинаковую амплитуду после оконного преобразования.
источник