Я ищу программу, независимую от динамиков (коммерческую или бесплатную), которая позволила бы мне транскрибировать файлы MP3, содержащие записи речи (особенно подкасты), в текст. Я хотел попробовать Dragon Naturally Speaking, но похоже, что он поддерживает только запись моих собственных речевых записей. Так каковы альтернативы?
16
Ответы:
Dragon Naturally Speaking импортирует mp3-файлы и пытается их расшифровать. Он предпочитает настраивать распознавание голоса на отдельного динамика, но справляется с этим без настройки. Вероятно, будет лучше, если ваши колонки подкастов будут звучать как Tom Brokaw
источник
Одним из возможных решений было бы загрузить свое видео на Youtube и попробовать автоматические подписи, которые вы можете включить ... это еще не слишком точно, но вы можете загрузить файл подписей и отредактировать его самостоятельно, если это поможет ... как по вопросам авторского права / пиратства для песни, вы можете сделать видео приватным в своем профиле, если это вообще возможно?
источник
Я бы рекомендовал не пытаться использовать Dragon Naturally Speaking - я написал несколько скриптов на своем джейлбрейкнутом iphone, чтобы скопировать / преобразовать все файлы голосовой почты с моего телефона в папку на моем компьютере, и для них была запущена служба транскрипции Dragon Naturally Speaking.
Результат запуска транскрипции для файлов с разными динамиками был абсолютно непригодным. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от говорящего распознавание голоса все еще кажется ограниченным очень маленькими словарями.
источник
Я использую http://www.voicebase.com с подкастом и видео на английском, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.
Вы можете скачать аудио транскрипцию на RTF, SRT или PDF.
Вы можете скачать машинную транскрипцию через 10-15 минут после загрузки, а иногда и рано.
источник
Открытый исходный код: CMU Sphinx
Условно-бесплатная: http://www.e-speaking.com/ (Windows)
Рекламный ролик: Dragon NaturallySpeaking (Windows)
Вы также можете попробовать этот метод, если вы пытались с OSX, что можно сделать с помощью Audacity и Soundflower
Вы также можете найти некоторые соответствующие ссылки для opensource, который стоит попробовать еще в одном условно-бесплатном ПО - voxcribecc.
Если вы программист .net, вы можете использовать этот метод, чтобы сделать свой собственный комплект
источник
Podzinger был бы отличным решением, но я не уверен, что ramp (новое название для компании, которая раньше была EveryZing, которая производила Podzinger), предлагает услугу бесплатно ...
http://en.wikipedia.org/wiki/Podzinger
источник