Преобразование Фурье обычно используется для частотного анализа звуков. Тем не менее, у него есть некоторые недостатки, когда дело доходит до анализа восприятия звука человеком. Например, его частотные интервалы являются линейными, тогда как человеческое ухо реагирует на частоту логарифмически, а не линейно .
Вейвлет-преобразования могут изменять разрешение для разных частотных диапазонов , в отличие от преобразования Фурье. Вейвлет - преобразование'S свойства позволяют большие временные опоры для более низких частот, сохраняя при этом короткие временные ширины для более высоких частот.
Morlet вейвлета тесно связана с человеческим восприятием слуха. Он может применяться к транскрипции музыки и дает очень точные результаты, которые невозможны при использовании методов преобразования Фурье. Он способен захватывать короткие серии повторяющихся и чередующихся музыкальных нот с четким временем начала и окончания для каждой ноты.
Преобразование с постоянным Q (тесно связанное с вейвлет-преобразованием Морле) также хорошо подходит для музыкальных данных . Поскольку выходной сигнал преобразования эффективно равен амплитуде / фазе относительно логарифмической частоты, для эффективного охвата заданного диапазона требуется меньше спектральных интервалов, и это оказывается полезным, когда частоты охватывают несколько октав.
Преобразование демонстрирует снижение разрешения по частоте с более высокими частотными бинами, что желательно для слуховых приложений. Он отражает слуховую систему человека, благодаря чему спектральное разрешение на низких частотах лучше, а временное разрешение улучшается на высоких частотах.
Мой вопрос заключается в следующем: существуют ли другие преобразования, которые близко имитируют слуховую систему человека? Кто-нибудь пытался разработать преобразование, которое анатомически / неврологически максимально соответствовало бы слуховой системе человека?
Например, известно, что уши человека имеют логарифмическую реакцию на интенсивность звука . Известно также, что контуры одинаковой громкости изменяются не только с интенсивностью, но и с разносом частот спектральных составляющих . Звуки, содержащие спектральные компоненты во многих критических полосах, воспринимаются как громкие, даже если общее звуковое давление остается постоянным.
Наконец, человеческое ухо имеет ограниченное по частоте временное разрешение . Возможно, это можно принять во внимание.
Ответы:
При разработке таких преобразований следует учитывать конкурирующие интересы:
В последнее время меня привлекли два последних дизайна: вейвлет-преобразование гамма-тона, вызванное слухом , обработка сигналов, 2014
Преобразование ERBlet: основанное на слухе частотно-временное представление с идеальной реконструкцией , ICASSP 2013
И я также упомяну:
Аудиторское преобразование для обработки аудиосигнала, WASPAA 2009
источник