Я ищу программное обеспечение, которое позволило бы мне ввести аудиофайл (.wav .mp3 ...) и вывести текст аудиофайла.
Такое программное обеспечение существует? Я нашел только программное обеспечение, которое преобразует (живой) голос в текст, но не аудио файлы в текст.
источник
Это не дает конкретного ответа на ваш вопрос, но в вашей ситуации я хотел бы распространить его как работу Amazon Mechanical Turk. Вы, вероятно, получите лучшие результаты и заплатите наименьшее количество долларов таким образом.
источник
eMicrophones делает коммерческий продукт под названием Инструментарий распознавания речи Windows это добавляет много полезного в Windows Speech Recognition, включая возможность транскрибировать файлы * .WAV (при условии, что они от вас, т.е. запись, как будто вы говорите, а не произвольный голос). Из списка возможностей:
источник
Вы можете добавить программное обеспечение VOICE NOTE (бесплатно) в Google Voice. Это превращает разговор в текст. Затем просто проиграйте запись голоса на своем динамике прямо в микрофон в VOICE NOTE.
Я планирую использовать VOICENOTE, чтобы переписать мои письменные заметки в текст и сохранить в MS Word. Затем, когда я сохраняю документ, Windows может искать мои рукописные заметки на компьютере. В противном случае рукописные заметки можно сохранить только как изображение. Только заголовки доступны для поиска, и вы не можете найти слова документа для поиска.
источник
Есть программный проект под названием «fancribe», который разбивает запись и разбивает ее на части, распространяя среди заинтересованных лиц, которые могут переписать часть.
https://github.com/fanscribed/fanscribed/blob/master/README.rst
источник