У кого-нибудь есть простое руководство по запуску распознавания речи в Linux? Я вижу, что pocketsphinx доступен в виде бинарной загрузки в центре программного обеспечения, но при запуске его из терминала не получается сообщить о том, что ему нужны параметры, но я не знаю, что туда поместить. Я попытался установить все перечисленные голосовые модели, но я не знаю, где они сохранены или как заставить их работать. Я также не был уверен, что делать, чтобы Sphinx3 работал. Страницы Sphinx3 кажутся сломанными, а у карманного сфинкса нет примера использования, который имеет смысл для меня.
Я ищу что-то, что получит 60% правильное распознавание по микрофонному вводу с ограниченным словарным запасом и словами, а затем может записать это в текстовый файл - этот материал существовал в конце 1980-х годов. Итак, я знаю, что он существует и должен как-то работать.
Благодарю.
(PS Интернет-соединение не идет)
источник
Ответы:
Попробуйте Саймон Слушает
Для загрузки и получения дополнительной информации посетите сайт simon на kde.org.
источник
Попробуйте использовать речь к тексту в Linux , основываясь на распознавании речи Google и интегрированной в приложения Linux
источник
Уровень точности зависит от множества факторов, таких как акцент, фоновые шумы, качество записи. Предварительно обученные модели немного ограничены, и в моих проектах транскрипции вместо Transcriear использовался инструмент преобразования речи в текст на основе веб-браузера.
источник