Извлечение данных из более чем 100 гиперссылок веб-страницы

-2

Я использую этот сайт, который имеет гиперссылку для ряда компаний. Я хочу извлечь детали компаний.

Когда я нажимаю на компанию, появляется гиперссылка «Сертификат» с названием, адресом, номером телефона, номером факса, продуктом. Я копирую данные из гиперссылок сертификатов.

Можно ли как-нибудь автоматизировать эту процедуру и извлечь данные в Excel?

я не могу добавить изображение пожалуйста, попробуйте с указанным выше путем файла. В сертификате отображаются данные о формиате изображения.

Маг А
источник
Всякий раз, когда я нажимаю на такую ​​ссылку «Сертификат», я получаю сообщение об ошибке 404, например, fieo.org/certificate.php?memberfieotoken=26015
slhck
да, я думаю, что есть проблема с сервером. но если веб-страница имеет конечный номер гиперссылки на странице, возможно ли извлечь данные из этих гиперссылок?
Маг
Если бы вы были действительно заинтересованы, вы могли бы определенно автоматизировать это с PowerShell. Затем Powershell может сохранить всю информацию в формате, совместимом с Excel
mrwhale

Ответы:

0

Возможно, вы найдете следующее полезное: http://webscraper.io/ имеет бесплатное расширение для Chrome. Я не пробовал это. Я использовал плагины Firefox Down Them All плюс Flashgot, но я нашел это немного хитрым.

Я не думаю, что какой-либо из этих подходов сразу даст вам файлы Excel - тогда вам придется выполнить какое-то преобразование.

aparente001
источник