Техника обработки сигналов, Мелкополосный Кепстр , часто используется для извлечения информации из музыкальной пьесы для использования в задаче машинного обучения. Этот метод дает кратковременный спектр мощности, а коэффициенты используются в качестве входных данных.
При проектировании систем поиска музыки такие коэффициенты считаются характерными для произведения (очевидно, не обязательно уникальными, но отличительными). Существуют ли характеристики, которые лучше подходят для обучения в сети? Будут ли более эффективными изменяющиеся во времени характеристики, такие как прогрессия басов пьесы, используемой в чем-то вроде сети Элмана ?
Какие характеристики сформируют достаточно обширный набор, на котором может проводиться классификация?
Ответы:
В какой-то момент мы проделали небольшую работу над этим. Набор функций, которые мы извлекли, дан в этом документе семинара NIPS . Я должен признать, что мы не смогли воспроизвести результаты некоторых других авторов в этой области, хотя были некоторые сомнения относительно наборов данных, используемых в них (обратите внимание, что наборы данных, используемые авторами в этой области, как правило, выбираются вручную и не публикуются для общественности, по причинам авторского права, хотя это не всегда так). По сути, все они были кратковременными спектральными особенностями.с добавленными коэффициентами авторегрессии. Мы рассматривали классификацию жанров, которая, как мы знаем, может быть сделана людьми (хотя и не с удивительной точностью и не с непротиворечивым согласием ...) в очень короткие промежутки времени (<1 с), что подтверждает использование краткосрочных функций , Если вы заинтересованы в более сложных вещах, чем типичная классификация жанра / исполнителя / альбома / продюсера, то вам могут потребоваться более широкие возможности, в противном случае эти краткосрочные спектральные характеристики имеют тенденцию работать лучше всего.
источник