Как я могу использовать распознавание голоса, используемое Android на Ubuntu?

16

Если я разрабатываю приложение для Android, которое использует TTS и распознавание голоса, какие библиотеки используются для одинакового распознавания голоса и речи в Ubuntu?

Я предполагаю espeak для преобразования текста в речь, но я не уверен, какая библиотека распознавания голоса и система словаря / обучения / калибровки используются для распознавания голоса.

Я хотел бы сделать приложение доступным на Ubuntu Desktop.
а также проверить его вне эмулятора

RobotHumans
источник
проверьте это, но хотя нет никакого существенного ответа
devav2
@ devav2 спасибо за усилия, но на самом деле не связаны. голосовой вход в систему и какой инструментарий распознавания голоса используется на Android (и если он доступен в Ubuntu) - это две совершенно разные вещи.
RobotHumans
Вероятно, вам нужно будет выяснить, какие именно библиотеки Android использует в других местах, а затем вернуться сюда и спросить, как их использовать в Ubuntu. Если вы не можете найти его в документации по Android, вам могут помочь энтузиасты Android или переполнение стека .
rndrük
Не уверен насчет использования его с Android, но Festival / festvox звучит гораздо менее роботизировано, чем espeak. Что касается распознавания речи, en.wikipedia.org/wiki/… может помочь.
Адам
Ну, espeak теперь входит в стандартную комплектацию рабочего стола Ubuntu ... так что никакой зависимости не добавлено. С другой стороны, платные пакеты от Cepstral не ужасно дороги, и они граничат с Skeksi.
RobotHumans

Ответы:

5

Вы можете использовать API веб- речи Google для своего приложения. Он использует ту же технологию, что и на Android.

ishitor
источник
Если вы отредактируете немного больше данных, я также предоставлю этот прием
RobotHumans
Честно говоря, у меня недостаточно опыта работы с их API, чтобы дать вам эту информацию!
ishitor
Это может быть интересным дополнением: простой проект по переносу речи Google в текст на мой рабочий стол.
Стефан Гурихон
1
  1. Распознавание голоса в Android зависит от подключения к Интернету, поскольку на сервере имеется обширная база данных шаблонов голоса. (Я думаю)

    • Компьютеры еще не очень хорошо распознают голос, поэтому вам нужна огромная база данных с большим количеством голосов, чтобы компьютер мог ссылаться и лучше понимать слова. (По крайней мере, в последний раз я изучал это)

    • Как так, вы не можете использовать его в автономном режиме.

  2. Однако вы можете использовать распознавание голоса для записи через обходной путь

    • Создавая удаленный рабочий стол / соединение VNC, и прямой

    • или с помощью приложения удаленной клавиатуры.

Chrome может использовать распознавание голоса для поиска, а с расширением - для заполнения данных поля. но насколько я знаю, вот и все.

и это все, что я знаю.

TardisGuy
источник
Я понимаю, что для распознавания голоса требуется корпус, чтобы выучить слова, помимо простых фонетических и словарей (поэтому нечеткие совпадения могут быть сделаны, когда вы не произносите). Я в порядке с требованием подключения к интернету, если это можно использовать.
RobotHumans
0

Возможно, вы используете CMU Sphinx, его можно использовать как инструментарий для разработки распознавания речи как в Linux, так и в Android: CMU Sphinx

oentoro
источник