Вопросы с тегом «mfcc»

20
Как интерпретировать шаг DCT в процессе извлечения MFCC?

В большинстве задач обработки аудио одним из наиболее часто используемых преобразований является MFCC (кепстральные коэффициенты Mel-частоты) . Я в основном знаю математику, стоящую за MFCC: я понимаю и шаг набора фильтров, и масштабирование по Мелу. Что я не получаю, так это шаг DCT (дискретное...

17
Помощь в расчете / понимании MFCC: коэффициенты Mel-Frequency Cepstrum

Я читал кусочки в Интернете, но я просто не могу собрать все это вместе. У меня есть некоторые базовые знания о сигналах / DSP, что должно быть достаточно предпосылок для этого. Я заинтересован в том, чтобы в конечном итоге кодировать этот алгоритм на Java, но пока не до конца его понимаю, поэтому...

15
Извлечение функций для классификации звука

Я пытаюсь извлечь функции из звукового файла и классифицировать звук как принадлежащий к определенной категории (например: лай собаки, двигатель автомобиля и т. Д.). Я хотел бы получить некоторую ясность по следующим вопросам: 1) это вообще выполнимо? Существуют программы, которые могут...

15
Кепстральная средняя нормализация

Может кто-нибудь объяснить, пожалуйста, о нормализации Cepstral Среднее, как свойство эквивалентности свертки влияет на это? Должно ли это делать CMN в распознавании речи на основе MFCC? Почему свойство свертки является фундаментальной необходимостью для MFCC? Я очень новичок в этой обработке...

9
Это правильная интерпретация шага DCT в расчете MFCC?

Это продолжение обсуждения здесь . Я бы прокомментировал там, но у меня нет 50 представителей, поэтому я задаю новый вопрос. Вот как я понимаю шаг DCT в процессе расчета MFCC: обоснование этого состоит в том, чтобы отделить корреляцию в лог-спектральных величинах (от набора фильтров) из-за...