Вопросы с тегом «beautifulsoup»

Beautiful Soup - это пакет Python для анализа HTML / XML. Последней версией этого пакета является версия 4, импортированная как bs4.

1301
UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xa0' в позиции 20: порядковый номер не в диапазоне (128)

У меня проблемы с работой символов юникода из текста, полученного с разных веб-страниц (на разных сайтах). Я использую BeautifulSoup. Проблема в том, что ошибка не всегда воспроизводима; иногда он работает с некоторыми страницами, а иногда он бросает a UnicodeEncodeError. Я перепробовал практически...

386
Как найти элементы по классу

У меня проблемы с анализом HTML-элементов с атрибутом "class" с помощью Beautifulsoup. Код выглядит так soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div Я получаю сообщение об ошибке в той же строке «после» сценария...

225
bs4.FeatureNotFound: Не удалось найти конструктор дерева с требуемыми функциями: lxml. Вам нужно установить библиотеку парсера?

... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Вышеуказанные выводы на моем...

173
TypeError: требуется байтоподобный объект, а не 'str' в python и CSV

TypeError: требуется байтоподобный объект, а не 'str' Ошибка выше при выполнении кода ниже python для сохранения данных таблицы HTML в файле CSV. не знаю, как получить rideup.pls, помогите мне. import csv import requests from bs4 import BeautifulSoup...

147
Красивый суп и извлечение div и его содержимого по ID

soup.find("tagName", { "id" : "articlebody" }) Почему это НЕ возвращает <div id="articlebody"> ... </div>теги и прочее между ними? Ничего не возвращает И я точно знаю, что он существует, потому что я смотрю прямо на него с soup.prettify() soup.find("div", { "id" : "articlebody" }) тоже...

144
получать ссылки с веб-страницы с помощью python и BeautifulSoup [закрыто]

Закрыто . Этот вопрос требует подробностей или ясности . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Добавьте подробности и проясните проблему, отредактировав этот пост . Закрыт 2 месяца назад . Уточните этот вопрос Как я могу получить ссылки веб-страницы и скопировать...

138
ImportError: Модуль без имени bs4 (BeautifulSoup)

Я работаю в Python и использую Flask. Когда я запускаю свой основной файл Python на моем компьютере, он работает отлично, но когда я активирую venv и запускаю файл Flask Python в терминале, он говорит, что мой основной файл Python имеет «No Module Named bs4». Любые комментарии или советы с...

125
BeautifulSoup Захватить видимый текст веб-страницы

По сути, я хочу использовать BeautifulSoup для получения строго видимого текста на веб-странице. Например, эта веб-страница - мой тестовый пример. И в основном я хочу просто получить основной текст (статью) и, возможно, даже несколько названий вкладок здесь и там. Я пробовал предложение в этом...

113
Извлечение значения атрибута с помощью beautifulsoup

Я пытаюсь извлечь содержимое одного атрибута value в конкретном теге input на веб-странице. Я использую следующий код: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import BeautifulStoneSoup soup = BeautifulStoneSoup(s) inputTag =...

98
Python: BeautifulSoup - получить значение атрибута на основе имени атрибута

Я хочу напечатать значение атрибута на основе его имени, например, <META NAME="City" content="Austin"> Я хочу сделать что-то подобное soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup('meta'): if meta_tag['name'] == 'City': print meta_tag['content']...

89
Таблица синтаксического анализа Python BeautifulSoup

Я изучаю Python requestsи BeautifulSoup. В качестве упражнения я решил написать быстрый парсер парковочных талонов Нью-Йорка. Я могу получить ответ в формате html, который довольно уродлив. Мне нужно взять lineItemsTableи разобрать все билеты. Вы можете воспроизвести страницу, перейдя сюда:...

86
Как найти теги только с определенными атрибутами - BeautifulSoup

Как мне с помощью BeautifulSoup искать теги, содержащие ТОЛЬКО атрибуты, которые я ищу? Например, я хочу найти все <td valign="top"> теги. Следующий код: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) получает все данные, которые я хочу, но также захватывает любой...