У меня есть тридцать второй речевой сигнал, который был дискретизирован с частотой 44,1 кГц. Теперь я хотел бы показать, какие частоты имеет речь. Тем не менее, я не уверен, что будет лучшим способом сделать это. Иногда кажется, что каждый вычисляет абсолютное значение преобразования Фурье, а иногда спектральную плотность мощности. Если я правильно понимаю, последний работает так, что я делю свой сигнал на части, делаю FFT по частям и как-то суммирую их. Оконные функции как-то задействованы. Не могли бы вы немного уточнить это для меня? Я новичок в DSP.
12
Ответы:
Если вы хотите придать физический смысл своему анализу, тогда используйте спектральную плотность мощности (PSD). Это потому, что это просто даст вам мощность вашего сигнала в каждой полосе частот. С другой стороны, если вы не хотите / не заботитесь о физическом значении, но хотите знать, как амплитуды Фурье каждой полосы изменяются относительно друг друга, вы можете придерживаться абсолютной величины.
Нет, это не так То, о чем вы здесь говорите, относится к кратковременному преобразованию Фурье (STFT). Это просто прерывание вашего сигнала во временной области, его овдовение, а затем получение фурье-формы. В конце дня у вас все равно будет сложная матрица. Если вы решите взять его абсолютную величину, у вас будет матрица преобразования Фурье абсолютной величины. Если вы возьмете его квадрат абсолютной величины, у вас будет матрица спектральной плотности мощности.
источник
Важно понимать, что речь идет о речевом сигнале: его частотные составляющие меняются во времени . Чтобы представить речь в частотной области, мы обычно берем достаточно короткое окно сигнала, в пределах которого можно предположить, что спектр речи существенно не изменяется (обычно 10 мс). Таким образом, мы рассчитываем спектр мощности для каждого последующего окна 10 мс, используя STFT (часто с некоторым перекрытием между окнами), и рассматриваем каждый последующий спектр как «снимок» частотных компонентов речи в это конкретное время. Часто последовательные спектры строятся на трехмерном графике, таком как спектрограммасо временем по оси X, частотой по оси Y и амплитудой, нанесенной в виде фальшивого цвета или интенсивности серой шкалы в каждом местоположении X, Y.
источник