Еще во времена 8-битных персональных компьютеров с тактовой частотой 1 МГц (Apple II, Atari 800 и т. Д.) Существовали программы, которые могли выполнять понятный произвольный синтез текста в речь на этих ПК. Какие опубликованные алгоритмы синтеза речи могут быть пригодны для реализации на микроконтроллерах с аналогичным ограничением производительности и памяти? (Если есть ...)
speech-synthesis
hotpaw2
источник
источник
Ответы:
Методы, с которыми я играл на 8-битных домашних компьютерах еще в 80-х годах, включали небольшой набор фонетических сэмплов, а затем определение текста, который вы хотите произнести, в терминах этих сэмплов.
Поскольку в то время я не знал об IPA , я просто использовал два звука на букву и выделил короткий звук строчными буквами, а длинные - прописными. Это оставило довольно много пробелов, хотя, о для / ɒ / ( горячий ) и O для / oʊ / ( открытый ) были просты, но / uː / ( звук oo в луне ) не мог быть представлен в моей системе, что была проблемой для меня, учитывая мое имя (/ BUD / рифмуется с / SMUD /, попробовать их в Itinerarium сек синтеза фонемы веб - странице).
В эти дни вы могли бы делать гораздо более умные вещи. Для начала вы можете использовать методы поиска для перевода известных слов в орфографическом тексте в ваши известные фонетические символы, а для неизвестных слов реализация фонетики как алгоритма должна выполнять разумную работу.
После получения фонетического потока вы, вероятно, сможете использовать методы DMA для потоковой передачи отдельных семплов фонем из памяти в ваш ЦАП, с меньшими издержками на ваш ЦП.
источник