Транскрипция полифонической музыки в настоящее время, похоже, не является решенной проблемой.
Как насчет обратной части небольшой проблемы. Существуют ли какие-либо спектральные характеристики (из STFT), которые можно использовать для исключения некоторых музыкальных аккордов из вероятностного пространства? (например, этот фрагмент звука, скорее всего, не содержит аккорда C # или какого-либо уменьшенного минорного аккорда, или это одна нота, а не аккорд и т. д.)
Предположим, что аудио фрагмент более или менее постоянен (временная атака удалена и т. Д.), И что обертоны для большинства или всех отдельных нот присутствуют с большой вероятностью. (И этот вопрос не о перевернутых аккордах.)
music
frequency-spectrum
hotpaw2
источник
источник
Ответы:
Проблема транскрипции полифонической музыки в последние годы привлекала к себе огромное внимание исследователей, и я бы сказал, что для полифонии одного инструмента (фортепиано, гитара и т. Д.) Результаты очень хорошие. Вот несколько статей / авторов, которые глубоко изучили эту проблему. Дерри Фицджеральд много сделал в этой области, большая часть его работы NMF по разделению источников производит точные транскрипции. Ансси Клапури еще более детально рассмотрел проблему обнаружения аккордов в полифонических инструментах. И, наконец, Микель Гейнза , хотя и не опубликованный, разработал очень точные алгоритмы транскрипции аккордов для коммерческой музыки, которые вскоре будут выпущены в программном продукте Riffstation на гитаре., Публикации в ссылках, приведенных здесь, должны дать вам хорошее представление о том, как в настоящее время находится ландшафт транскрипции полифонической музыки.
источник
Что ж, для этого STFT будет содержать только компонент основной частоты и другие частоты, близкие к его гармоникам (хотя не точные из-за негармоничности ). Найдите пики в спектре и посмотрите, близки ли верхние частоты к целочисленным кратным самой низкой присутствующей частоты. Если присутствуют негармоничные частоты, то это не один тон.
(Но как насчет инструментов с отсутствующими фундаментальными или принципиально негармоничными вещами, такими как колокольчики? Как насчет двух инструментов, которые идеально настроены на октаву, так что их частичные характеристики в основном совпадают друг с другом? Вы хотите определить это как одну ноту или две заметки?)
источник