Я ищу простое в установке программное обеспечение преобразования текста в речь для Ubuntu, которое звучит естественно. Я установил Festival
, Gespeaker
и т.д., но ничего не звучит очень естественно. Все очень синтетично и трудно понять.
Есть какие-нибудь рекомендации?
software-recommendation
text-to-speech
Я Сердце Ubuntu
источник
источник
Ответы:
SVOX pico2wave
Очень минималистичный TTS, лучше звучащий, чем espeak или mbrola (на мой взгляд). Некоторая информация здесь .
Я не понимаю, почему pico2wave, по сравнению с espeak или mbrola, редко обсуждается. Это маленький, но звучит очень хорошо (естественно). Без изменений вы услышите естественно звучащий женский голос.
И ... по сравнению с Mbrola, он распознает единицы и говорит это правильно!
Например:
После установки я использую его в скрипте:
Затем запустите его с нужным текстом:
или прочитайте содержимое всего файла:
Вот и все, чтобы иметь легкий, стабильно работающий TTS на Ubuntu.
источник
pico2wave
находится в пакетеlibttspico-utils
в последних версиях Ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Согласитесь, что этот интерфейс CLI плохой дизайн: в отличие от огромного большинства CLI, и возможно достичь максимальной длины аргумента CLI ОС .echo {1..1000}
Скажи это!
Я считаю, что нашел лучшее программное обеспечение TTS бесплатно, используя расширение Google Chrome под названием «SpeakIt». Это работает только в браузере Chrome для меня на Ubuntu. По какой-то причине он не работает с Chromium. SpeakIt поставляется с двумя женскими голосами, которые звучат очень реалистично по сравнению со всем остальным. В списке расширений Chrome есть еще как минимум четыре мужских и женских голоса, если вы выполняете поиск в Chrome Web Store, используя в качестве запроса "TTS".
Использование : для использования на веб-сайте. Вы выделяете текст, который хотите прочитать, и либо щелкаете правой кнопкой мыши и «SpeakIt», либо щелкаете по значку SpeakIt, закрепленному на верхней панели Chrome.
У пользователей Firefox также есть два варианта. В аддонах Firefox выполните поиск TTS, и вы должны найти «Click Speak», а также «Text to Voice». Голоса не так хороши, как голоса Chrome SpeakIt, но, безусловно, пригодны для использования.
Расширение SpeakIt использует технологию iSpeech и по цене 20 долларов в год сайт может конвертировать текст в аудиофайлы MP3. Вы можете вводить текст, URL-адреса, RSS-каналы, а также документы, такие как TXT, DOC и PDF, и выводить их в MP3. Вы можете создавать подкасты, вставлять аудио и т. Д. Вот ссылка и образец их аудио (не знаю, как долго будет длиться ссылка).
источник
Пико и Эспик - это весело и легко добраться до работы, но они не так уж хороши. Фестивальные голоса по умолчанию также не так хороши. Тем не менее, Festival - это основанная на схеме речевая структура, в которой ряд исследователей создали гораздо лучшие подключаемые голоса. Вы можете легко превзойти качество pico2wave на стандартной Ubuntu, потому что один из этих голосов доступен в виде готового пакета.
Чтобы фестиваль звучал естественно, вот что нужно сделать:
Вы можете сделать это из командной строки, используя
-b
(или--batch
) и поместив каждую команду в одинарные кавычки:Вы можете получить другие неплохие голоса из репозитория Nitech, но их установка очень сложна, и пути по умолчанию изменены, поэтому ссылки на имена файлов в связанных файлах схемы, возможно, придется отредактировать вручную для работы на стандартной Ubuntu.
источник
Простой Google ™ TTS
Обновление со страницы проекта (2019-02) : этот проект в настоящее время не поддерживается и останется таковым в обозримом будущем.
Из-за отсутствия лучшей альтернативы я написал сценарий bash, который связывается со сценарием perl от Michal Fapso для предоставления TTS через Google Translate. Из описания проекта:
Основными функциями являются:
Установка и использование документированы на странице проекта .
Буду рад, если вы попробуете. Сообщения об ошибках и любые другие отзывы приветствуются!
источник
Я посмотрел высоко и низко для преобразования текста в речь для Ubuntu, что является высоким качеством. Здесь ничего нет. Мои голосовые связки парализованы, поэтому мне понадобился TTS, чтобы добавить голосовые инструкции к моим видео Ubuntu . Вы можете получить коммерческое высококачественное программное обеспечение для преобразования текста в речь здесь . Это просто очень дорого. В итоге я купил Natural Reader для Windows (не работает в Ubuntu под Wine) за 40 долларов. Возможно, позже я получу Linux.
источник
Я проводил исследования лучшего звучания и легко настраиваемого текста в речевые голоса. Ниже приведен список пяти лучших продуктов в порядке качества звука. Большинство веб-сайтов, связанных с этим продуктом, имеют интерактивную демонстрацию, которая позволит вам принять собственное решение.
источник
Я нахожу голоса Nitech HTS на фестивале очень естественными и утешительными по сравнению с любыми другими голосами, которые я слышал. Смотрите эту ссылку о том, как настроить Nitech и другие звуки с фестиваля. Я не нашел хорошего графического интерфейса, который я мог бы использовать для настройки этих голосов, но настройка их через festival.scm все еще работает. Это сообщение очень старое, и вы, возможно, захотите найти актуальный каталог установки с помощью команды "locate festival"
источник
Объедините инструменты SVOX (пико) с LibreOffice:
Инструменты SVOX (pico) просты в установке и обеспечивают хорошее качество голоса в Ubuntu. Установите это:
Вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:
Настройте параметры чтения текстового расширения с помощью Сервис - Дополнения - Чтение выделения .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY) , вы можете поэкспериментировать с некоторыми из них.
Теперь вам нужно только выбрать какой-нибудь текст в LO Writer, Calc, Impress или Draw и щелкнуть по значку, добавленному в качестве панели инструментов (счастливое лицо с шариком).
источник
Вот что я сделал, чтобы иметь чистую естественную речь для PDF и других текстовых файлов (другие решения не являются естественными, или они просто платные услуги). На самом деле это обходной путь с использованием хрома или хрома, но работает быстро и легко.
Также есть способы открыть другие файлы, такие как .doc и .txt, в chrome и сделать то же самое. Есть другие расширения для chrome, которые просматривают PDF-файлы, проверьте, подходит ли вам это лучше. Кроме того, вы можете загружать все виды текстов в Google Drive и использовать SpeakIt! читать это для вас. Другое расширение под названием «Говорить текст» работает так же и имеет естественную речь.
источник
При поиске лучшего движка tts для использования с новым режимом повествования firefox 49 я нашел pico tts (svox) - мой любимый движок TTS.
Как изменить стандартную систему синтеза речи по умолчанию?
Люди в Arch Linux привели меня на правильный путь:
Раскомментируйте понравившийся модуль и установите его по умолчанию в настройках диспетчера речи:
Перезапустите демон:
НО, при повторном запуске firefox ничего не происходит. По ссылке выше (арка на форуме № 10 и № 16) работает с фестивалем (не пробовал), но речевой диспетчер для пико не перечисляет доступные голоса. Это не будет работать.
Любая идея там будет высоко ценится ;-)
источник
Моя любимая программа преобразования текста в речь называется Magic English, но, как и Natural Reader, упомянутый Джо Стейгером, это программа для Windows, и я не уверен, будет ли она работать под Wine.
AT & T Natural Voices доступна в режиме онлайн в качестве демонстрации, но это скорее обходной путь, чем решение ...
источник
Простой Google ™ TTS
Пико, mbrola, cmu, фестиваль, флайт, все сосут в 2017 году (они были потрясающими в 90-х). Естественная речь AT & T (что фантастично) не совместима с Linux и не бесплатна, поэтому мы используем Google
источник
ГТЦ
Минусы : только для CLI. Нужно быть в сети, как это требуется для запроса к общедоступной открытой конечной точке Google.
использование
Документация и другие примеры
другие
Некоторые уже упоминались
Мимические . Монтаж:
eSpeak + Gespeaker (GUI) ( исходный код Gespeaker )
Минусы : старые и некрасивые
источник
Для этого я создаю Intelligent Speaker - расширение для Google Chrome. Он может читать страницы даже без выделения (когда текст задержание правильно).
источник