Кто-нибудь знает приложение, которое может конвертировать аудио в текст? Я использую Ubuntu 12.04 LTS.
27
Кто-нибудь знает приложение, которое может конвертировать аудио в текст? Я использую Ubuntu 12.04 LTS.
Ответы:
Программное обеспечение, которое вы можете использовать - CMUSphinx . В отличие от предложенного в другом ответе Юлиус не подходит, так как требует моделей. Модели для распознавания речи с большим словарным запасом не доступны для Юлиуса.
Вы можете использовать pocketsphinx для конвертации аудио файла. Эти две команды должны сделать работу. Сначала вы конвертируете файл в нужный формат, а затем узнаете его:
Бегущий карманный сфинкс
Результат будет сохранен в файле result.txt.
источник
speech recognition
voice command
pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.log
сработало. Возможно, они не являются оптимальными пакетами, но они были лучшими совпадениями, которые я мог найти в репозиториях.Я знаю, что это старо, но чтобы расширить ответ Николая и, надеюсь, сэкономить кому-то время в будущем, для того, чтобы получить актуальную версию pocketsphinx, вам нужно скомпилировать ее из репозитория github или sourceforge (не уверен который постоянно обновляется). Обратите внимание, что -j8 означает выполнение 8 отдельных заданий параллельно, если это возможно; если у вас больше процессорных ядер, вы можете увеличить их количество.
Затем: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/ загрузите новейшие версии
cmusphinx-en-us-....tar.gz
иen-70k-....lm.gz
Тогда, наконец, вы можете перейти к шагам из ответа Николая:
Сфинкс работает хорошо. Я бы не стал полагаться на это, чтобы сделать читабельную версию текста, но это достаточно хорошо, что вы можете искать его, если вы ищете конкретную цитату. Это особенно хорошо работает, если вы используете алгоритм поиска, такой как Xapian ( http://www.lesbonscomptes.com/recoll/ ), который принимает подстановочные знаки и не требует точных поисковых выражений.
Надеюсь это поможет.
источник
pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory
------->export LD_LIBRARY_PATH=/usr/local/lib
------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
Если вы хотите преобразовать речь в текст, попробуйте открыть свой Ubuntu Software Center и найти Julius
Описание
Или другой вариант, которого нет в Центре программного обеспечения, это Саймон
Ссылки Ссылки
http://julius.sourceforge.jp/en_index.php
http://sourceforge.net/projects/speech2text/
http://simon-listens.org/index.php?id=122&L=1
источник
Вы можете использовать панель транскрипции speechpad.pw
Смотрите видео об использовании транскрипции
источник