Есть ли способ загрузить автоматически сгенерированные транскрипции YouTube без загрузки видео?
Я хотел бы проверить доклады TED, но у меня ограниченная пропускная способность и я хотел бы экспортировать автоматизированные стенограммы (также известные как субтитры или закрытые титры).
Ответы:
Используйте функцию «Инспектор сети» в отладчике сценариев вашего браузера и найдите второй запрос к странице временного текста после включения транскрибированных субтитров, а затем просто скопируйте все эти запросы в адресную строку, чтобы загрузить их в собственном формате YouTube xml.
Чтобы получить версию SRT, запустите этот код в консоли отладчика для этой страницы XML:
Также здесь есть версия скрипта букмарклет:
источник
Есть несколько способов извлечь субтитры из видео на YouTube -
Указав язык и VideoId в этом универсальном URL -
http://www.youtube.com/api/timedtext?lang={LANG}&v={VIDEOID}
вы можете получить.xml
файл с субтитрами на нужном языке для выбранного видео.Чтобы избавиться от тегов в этом файле и просто получить расшифровку текста , вот что вам нужно сделать:
Кроме того, существует инструмент с открытым исходным кодом под названием Google2SRT, который одним щелчком загружает все доступные подпрограммы из видео YouTube и преобразует их в
.srt
формат, чтобы его можно было использовать в медиаплеерах, таких как VLC Media Player.Обновление: Ted.com теперь предоставляет стенограммы переговоров на своем сайте.
источник
http://video.google.com/timedtext?lang=english&v=b11AXknrsEI
но это не работает. Кроме того, посещение инструментов разработчика не помогает. Там есть тонны ресурсов, и ни один из них не говорит timedtext.english
кen
иeng
но делает то же самое.Я думаю, что этот скрипт должен работать на вас:
http://userscripts.org/scripts/show/50003/
источник
Google2SRT 0.6 поддерживает YouTube ASR: http://sourceforge.net/projects/google2srt/
источник
Если это ваше собственное видео, вы можете скачать субтитры из видео-менеджера. Перейти к:
Менеджер видео >> Редактировать (на нужном видео) >> Подписи >> (Нажмите на трек, который вы хотите скачать) >> Действия (раскрывающийся список)
На момент написания статьи доступно три типа файлов:
Они по-разному используются в разных приложениях, но очень похожи. СТО, пожалуй, самый распространенный.
В противном случае, если это не ваше видео, лучший способ (единственный метод) - получить файл XML из инструментов разработчика.
Используя Google Chrome в этом примере, перейдите к видео и выполните следующие действия:
timedtext?
плюс куча переменных. Второй, как правило, тот, который вы хотите. Это начинается так:<transcript> <text start="4.14" dur="3.049">my name is doctor john rush</text> <text start="7.189" dur="3.731">I'm the CEO and president</text>
Этот XML-файл полезен, если вы хотите использовать стенограмму на веб-странице. Кроме этого, я не думаю, что вы можете использовать его так же, как вы используете файл SRT. Если вы хорошо разбираетесь в программировании, вы можете легко написать программу, которая преобразует ее в SRT. Я написал свою собственную программу на C #, которая извлекает данные для другой цели, и это заняло менее двух часов.
источник