Вопросы с тегом «urlopen»

178
Соскребая веб-страницу JavaScript с Python

Я пытаюсь разработать простой веб-скребок. Я хочу извлечь текст без кода HTML. На самом деле я достиг этой цели, но я видел, что на некоторых страницах, где загружен JavaScript, я не добился хороших результатов. Например, если какой-то код JavaScript добавляет текст, я не вижу его, потому что когда...

177
Позвольте объекту JSON принимать байты или позволить выводить строки urlopen

В Python 3 я запрашиваю документ json с URL. response = urllib.request.urlopen(request) responseОбъект представляет собой файл-подобный объект с readи readlineметоды. Обычно объект JSON можно создать с помощью файла, открытого в текстовом режиме. obj = json.load(fp) Что я хотел бы сделать, это: obj...