Современное состояние в области интерполяции аудиосигналов

11

Три вопроса:

  1. Какие метрики можно использовать для объективного измерения качества интерполяции звука? (но также и с точки зрения психоакустики, если это возможно)

  2. По этим показателям, каково текущее состояние дел в аудио-интерполяции?

  3. Предположим, мне нужно было визуализировать два файла из последовательности заметок виртуальных инструментов в двух разрешениях, а затем сравнить повышающую дискретизацию одного файла с высокочастотной визуализированной версией. Какое программное обеспечение можно использовать для объективного сравнения? - в идеале, используя вышеупомянутые метрики

До сих пор, насколько я смог собрать, эти ресамплеры обеспечивают лучшее качество

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

Одна из проблем, с которыми, похоже, сталкиваются эти ресамплеры, - это до и после звонка.

Я должен отметить, что ключевой интерес представляет восстановление сигнала (поскольку этот термин имеет смысл), так что повышающая дискретизация больше, чем понижающая.

Изменить: Эффективность времени интерполяции не имеет значения в этом контексте.

С наилучшими пожеланиями, Любопытный :-)

Бент Расмуссен
источник

Ответы:

5

Что касается «проблемы», которую вы отмечаете с помощью ресамплеров:

Во многих алгоритмах передискретизации используется многофазное интерполяционное ядро ​​линейного фильтра нижних частот. Ядро интерполяции с фильтром минимальной фазы, в отличие от ядра интерполяции с линейной фазой (с той же частотной характеристикой), будет производить меньше предварительных звонков при повторной дискретизации до более высокой частоты дискретизации, которая может объективно измеряться как менее точная, но, возможно, психотропная. акустически звучит "лучше" для людей.

Вот примечание о создании минимальных фазовых фильтров для фильтрации с потенциально меньшим количеством предварительных звонков: http://www.music.columbia.edu/pipermail/music-dsp/2004-Feb February/ 059372.html

Кроме того, фильтр нижних частот, разработанный Ремесом (Паркс-Макклеллан), может иметь четкую периодическую пульсацию в частотной области, которая может также создавать импульс перед кольцом во временной области. Таким образом, вы можете вместо этого попробовать оконный Sinc или вывод классического аналогового фильтра для конструкции фильтра нижних частот (последний обычно приводит к чему-то ближе к минимальной фазе) для ядра интерполяции с передискретизацией.

hotpaw2
источник
Что касается вашей точки зрения о минимальных фазовых фильтрах: я не уверен насчет первых двух звеньев, но SRC iZotope позволяет плавно изменять фазу между минимальной и линейной. В тестах на слушание людям действительно нравится где-то между минимальной фазой и линейной фазой
Шнарф
Фильтр windowed-sinc не обязательно будет лучше, чем эквивалентный (разработанный через обмен Remez) фильтр в отношении звонков во временной области. Звонящий эффект называется феноменом Гиббса и наблюдается, когда вы ограничиваете полосу сигнала, который содержит разрывы (например, прямоугольная волна). Это не вызвано пульсацией в частотной области равновеликого фильтра. Эффект более заметен при использовании фильтров с очень резким обрезанием; увеличение ширины перехода может несколько смягчить его.
Джейсон Р
@Jason R: синусоида во временной области = импульс в частотной области, положение зависит от частоты пульсации синусоиды. Теперь поменяйте местами 2 домена и поместите синусоидальную пульсацию в ответ частотной области. Импульс переходит во временную область, положение в зависимости от характеристик пульсации.
hotpaw2
@ hotpaw2: я вижу твою аналогию. Я неправильно понял смысл вашего термина «импульс перед вызовом».
Джейсон Р
Кроме того, гладкое окно во временной области воспроизводит свою непрерывную форму вокруг разрывов в частотной области путем свертки, тем самым уменьшая перерегулирование Гиббса.
hotpaw2
6

Это довольно тщательное сравнение алгоритмов пересэмплирования: http://src.infinitewave.ca/

Вы можете увидеть тесты, которые они использовали там. Псевдоним является большим, и его легко визуализировать с помощью спектрограммы синусоидальной развертки. Существует также высокочастотный отклик - SRC может снижать высокие частоты в дополнение к тому, что они могут вызывать алиасинг. Вы можете визуализировать фазовый отклик с графиком импульсного отклика или с графиком фазового отклика.

schnarf
источник
Да, я знаю этот отличный ресурс. Я просто хотел знать все параметры, которые стоит измерять при измерении производительности передискретизации (в частности, повышающей дискретизации).
Бент Расмуссен