Голосовое управление средой рабочего стола

16

Я хотел бы включить систему, которая может отвечать на голосовые команды пользователя и запускать сценарии в соответствии с устной командой GIVEN.

В идеале хотелось бы, чтобы компьютер постоянно слушал.

Как только он услышит модное слово «Компьютер», он активируется и будет слушать команды в течение 10 секунд (или около того).

Будучи активным и слушающим, я хотел бы, чтобы другой набор модных слов мог запускать сценарии.

Например....

(Компьютер бездействует) «Компьютер» (компьютер сразу слушает) «Доступ к новым СООБЩЕНИЯМ» (СООБЩЕНИЯ - это модное слово * ИГНОРИРУЕТ «ДОСТУП К НОВОМУ» - компьютер запускает сценарий и открывает эволюцию или сочувствие). Там может быть один для браузера, один для закрытия окон и отображения рабочего стола, или куча вещей на самом деле.

Это вообще возможно?

BorgDomination
источник

Ответы:

7

Gnome-Voice-Control

Разработанная в рамках Google Summer of Code 2007, эта идея была направлена ​​на разработку некоторых функций, которые повысят удобство использования в Gnome Desktop.

Целью является внедрение системы голосового управления настольным компьютером. Система состоит из приложения, которое будет контролировать аудиовход (микрофон), и когда значительный аудиосигнал будет обнаружен, программное обеспечение перехватывает, обрабатывает и распознает сигнал, а затем выполняет требуемое действие на рабочем столе Gnome. В набор действий могут входить максимизация, минимизация, закрытие активного окна; открыть конкретную программу; переключение с одного рабочего стола на другой; среди других. GnomeVoiceControl реализован на C в сочетании с CMU Sphinx, который является инструментом с открытым исходным кодом, созданным для преобразования речи в текст.

Слайд-шоу авторов

К сожалению, похоже, что он не вышел далеко за рамки базовых «целей», однако, похоже, что в этом году была добавлена ​​поддержка новых языков, таких как болгарский и турецкий.

Установить:

sudo apt-get install gnome-voice-control

утконос

Интересный проект называется platypus - по сути, это интерфейс Linux для Dragon Naturally Speaking, который работает в Wine.

Заявка на известность этого приложения: «оно может даже запускать программы и сценарии Windows или Linux, например,« запуск терминала ».

VEDICS

Это новый проект, который говорит, что работает с интерфейсом Unity.

На странице проекта написано, что она распознает «run [имя программы]» - так что теоретически вы [имя программы] можете использовать любой скрипт, который хотите запустить.

fossfreedom
источник
Спасибо за исключительно быстрый ответ. Я слышал об этой программе и установил ее, но, похоже, она не прошла прежнюю настройку - она ​​просто говорит «config». Я удивлен, что на этом фронте не было сделано много работы. Может быть, есть подходящие окна, чтобы я мог бежать с вином?
BorgDomination
1
старая версия голоса гнома, которая находится в синаптическом режиме, дала мне те же результаты. Я попробовал последнюю версию с веб-сайта, и мне показалось, что она пошла дальше, но я так и не смог заставить ее работать должным образом. ручная зависимость была болью для.
Кендрик
3

Саймон слушает

Это проект с открытым исходным кодом, предназначенный для замены мыши и / или клавиатуры распознаванием речи, изначально разработанный для людей с ограниченными возможностями.

Существует ppa, откуда мы можем установить приложение : ppa: grasch-simon-listens / simon

Takkat
источник
Симон работает только с KDE? Это выглядит действительно круто, и я установил его, но не могу заставить его работать с gnome-shell. специально оконное управление. Например, если я хочу показать все окна, это будет работать по-разному в kde env и gnome env, верно?
Джошуа Робисон
1
Зависимости должны быть устранены при установке на Ubuntu <= 12.04 из ppa, но я недавно не пробовал, а также я не знаю, как это может повлиять на оболочку GNOME. Нет версии (пока) для 12.10.
Таккат
3

Google2Ubuntu

Google2Ubuntu - это инструмент, позволяющий управлять вашим компьютером с помощью голосовых команд через API распознавания речи Google.

Выполните следующие команды на терминале для установки google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Источник

Авинаш Радж
источник
1

Распознавание речи в Linux

Он разрабатывается для работы в дистрибутивах Linux, его очень легко настраивать и расширять, он поддерживает пользовательские словари, распознавание по контексту, режим диктовки и настраиваемые макросы.

Чтобы установить Linux Speech Recognition, перейдите на страницу проекта GitHub . Загрузите ZIP-файл и распакуйте его.

Затем установите некоторые зависимости:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Откройте извлеченную папку (Palaver-master) в терминале и выполните настройку:

cd /~Path-to-folder~/Palaver-master/
./setup

Теперь просто назначьте горячую клавишу для включения записи, для этого перейдите в «Настройки системы»> «Клавиатура»> «Ярлыки»> «Пользовательские ярлыки», нажмите кнопку «Плюс», чтобы добавить ярлык, назовите его «Распознавание голоса» и задайте команду:

/~Path-to-folder~/Palaver-master/hotkey

Нажмите «Применить», нажмите на ярлык, а затем назначьте горячую клавишу для активации распознавания голоса.

Обратите внимание, что стабильная сборка еще не выпущена, поэтому не ожидайте, что команды будут полностью функциональными на этом этапе, многие фразы будут распознаны, но никаких реальных действий не будет сделано.

Родриго Мартинс
источник
На данный момент Палавер мертв: github.com/JamezQ/Palaver/issues/110#issuecomment-398646686
user2740
0

Snips.ai

Только что попробовал на pi3 - кажется, есть потенциальные
прогоны в докере

https://snips.ai/

Пол Шнайдер
источник
1
Добро пожаловать в Спросите Ubuntu. Обратите внимание, что если вы связаны с этим инструментом, вы должны явно указать это в своем посте; см Как не спамер .
Глорфиндель
1
Официальный сайт гласит: Открытый исходный код: мы стремимся открывать Snips с течением времени , поэтому стоит попробовать Snips.
Карел