Вопросы с тегом «audio»

15
Более низкие частоты сильнее в БПФ?

Я рассчитываю БПФ от входа микрофона. Я заметил, что более низкие частоты, кажется, всегда имеют большую мощность (более высокий дБ), чем более высокие частоты. Я разрезал данные на 24576 байт (4096 * 6). Применить окно Хемминга: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs));...

15
Получение громкости трека с RMS

Я пытаюсь вычислить громкость звуковой дорожки, которую я сохранил в буфере. Буфер содержит данные PCM о сигнале, и я хочу узнать, насколько он «громкий», используя Root Mean Squared. Я предполагаю, что могу сделать это во временной области вместо того, чтобы переключаться в частотную область....

15
Как извлечь вокальную часть из стерео аудио сигнала?

Я сейчас обрабатываю файл MP3 и сталкиваюсь с этой проблемой. Мой MP3 стерео закодирован. То, что я хочу сделать, это извлечь вокальную партию для дальнейшей обработки (любой режим выходных сигналов, моно или стерео оба в порядке). Насколько я знаю, аудио кодируется в различные несочлененные...

15
Извлечение функций для классификации звука

Я пытаюсь извлечь функции из звукового файла и классифицировать звук как принадлежащий к определенной категории (например: лай собаки, двигатель автомобиля и т. Д.). Я хотел бы получить некоторую ясность по следующим вопросам: 1) это вообще выполнимо? Существуют программы, которые могут...

14
Определите, где пение начинается в записи только голоса

У меня есть небольшое приложение в стиле караоке, где пользователь поет 4 строки песни, с интервалом в одну секунду между каждой строкой. Бэк-музыки нет, так что это только голос, надеюсь, облегчить проблему. Я ищу наиболее надежный способ точно определить, где в моей записи пользователь начинает и...

14
Scipy - обработка аудио

Я ищу хорошие инструменты для обработки аудио сигнала. например, анализ речи и музыки, автоматическая идентификация языка и т. д. Предоставляет ли библиотека Scipy функции для обработки звука? Есть ли у него хороший инструмент для обработки аудио сигнала? Можете ли вы предложить инструмент для...

14
Какая конструкция полосового фильтра даст самый короткий импульсный отклик?

Разработка простого полосового фильтра IIR II-го порядка по Бутеруорту с центральной частотой 500 Гц и шириной полосы в 1 октаву дает мне следующую частотную характеристику ... Теперь, если я возьму импульсный отклик и нормализую его и переведу в дБ, мы можем наблюдать затухание импульсного...

14
Наиболее эффективный способ извлечения частотных компонентов аудиосигнала с почти человеческой точностью в режиме реального времени

Я пытаюсь выяснить, как (если это возможно) извлечь частотные компоненты произвольного аудиосэмпла (обычно музыки), как FFT, но в моем исследовании алгоритма FFT я узнаю, что он страдает некоторыми жесткие ограничения для этой цели. Есть 3 проблемы, которые представляет БПФ: Поскольку разрешение...

14
Когда начинается трек смеха?

Один из моих проектов выходного дня привел меня в глубокие воды обработки сигналов. Как и во всех моих проектах кода, которые требуют некоторой тяжелой математики, я более чем рад найти свой путь к решению, несмотря на отсутствие теоретического обоснования, но в этом случае у меня его нет, и я...

14
Какие методы можно использовать для идентификации и удаления эха из аудиосистемы?

Фон Я разрабатываю систему, которая будет иметь один маленький микрофон и динамики для использования в настройках типа телефона. Самый простой пример, который я могу привести, это разговор по Skype, где вы используете динамики своего компьютера и настольный микрофон. Я беспокоюсь о том, что звук из...

14
Оценивая время начала тонального шума?

Какие методы можно использовать для оценки времени начала синусоидального тона в шумном сигнале? Предположим, что импульс тона имеет известную фиксированную частоту (но неизвестную фазу) и очень резкое время нарастания, и что цель состоит в том, чтобы оценить время начала лучше, чем половина...

13
План обучения для начинающих по обработке звукового сигнала

Я хотел бы начать изучать обработку аудиосигнала. В Интернете есть множество книг и научных статей, которые, кажется, пропускают основы темы. Я хотел бы знать, так сказать, приблизительный план действий, чтобы успешно освоить обработку аудиосигнала. Я прочитал, что исчисление является первым шагом...

12
Параметрически ухудшить речь, убрать эмоциональный контент

Я рад принять предложения в R или Matlab, но приведенный ниже код предназначен только для R. Аудиофайл, прикрепленный ниже, представляет собой небольшую беседу между двумя людьми. Моя цель - исказить их речь, чтобы эмоциональное содержание стало неузнаваемым. Сложность в том, что мне нужно...

12
Обнаружение ударов в минуту в шумном файле .wav

Я ищу алгоритм (ы) для решения следующей проблемы: Как определить частоту ударов мягкого барабана, учитывая шумный захват звука .wav (некоторый ветер + шум трения на микрофоне)? Я попытался найти предмет, но результаты довольно плохие из-за большого количества программного обеспечения, связанного с...

12
Когда следует учитывать двойную (64-битную) плавающую точку для аудио

При синтезе и обработке звука на современных процессорах, когда можно было бы использовать что-то кроме 32-битной плавающей запятой одинарной точности? Очевидно, что звук, поступающий и выходящий из реального мира, имеет 16/24 бит, поэтому я просто говорю о точности сигналов (как самого звука, так...

12
Как ресэмплировать аудио, используя FFT или DFT

Я выбрал голосовое аудио, сначала выполнив БПФ, затем взяв только те части результата, которые мне нужны, и затем выполнив обратное БПФ. Тем не менее, он работает должным образом только тогда, когда я использую частоты, которые обе имеют степень двойки, скажем, понижающую дискретизацию с 32768 до...

12
Вычитание выходного сигнала датчиков, имеющих взаимную индуктивность между ними

Справочная информация: программное обеспечение, которое я использую для анализа моих сигналов, является Matlab. У меня есть два аудиосигнала, которые были записаны с помощью двух магнитных датчиков. Позволяет назвать один датчик A, а другой B. A и B имеют взаимную индуктивность между ними. Пока...

12
Эффективный расчет автокорреляции с использованием БПФ

Я пытаюсь вычислить автокорреляцию на платформе, где единственный доступный ускоренный примитив - это (I) FFT. У меня проблема, хотя. Я прототипировал его в MATLAB . Я, однако, немного смущен. Я предположил, что это работает просто следующим образом (это из памяти, поэтому извиняюсь, если я немного...

12
Определение того, насколько звук похож на человеческую речь

В поисках ответа на эту проблему я обнаружил, что эта доска объявлений решила опубликовать мой вопрос в переполнении стека. Я ищу способ определения сходства между аудиосегментом и человеческим голосом, который выражается численно. Я немного искал, но то, что я нашел до сих пор (подробно описано...

12
Добавить нечетные / четные гармоники в сигнал?

Как добавить нечетные или четные гармоники в сигнал с плавающей запятой? Должен ли я использовать Тан или грех? Я пытаюсь добиться очень простых эффектов искажения, но мне трудно найти точные ссылки. То, что я хотел бы, - это что-то похожее на то, что делает Культурный гриф , добавляя нечетные и...