Одним из основных недостатков curl
является то, что все больше и больше веб-страниц окрашивают свой основной контент в ответ JavaScript AJAX, который происходит после первоначального ответа HTTP. curl
никогда не узнает об этом пост-окрашенном контенте.
Поэтому, чтобы получить эти типы веб-страниц из командной строки, я был ограничен написанием сценариев на Ruby, которые приводят SeleniumRC к запуску экземпляра Firefox, а затем возвращают исходный HTML-код после завершения этих вызовов AJAX.
Было бы намного лучше иметь более компактное решение командной строки для этого типа проблемы. Кто-нибудь знает что-нибудь?
Ответы:
Я только недавно начал использовать WebDriver из Selenium 2 в Java. Существует драйвер с именем HtmlUnitDriver, который полностью поддерживает JavaScript, но не запускает реальный браузер.
Это не легкое решение, но оно выполняет свою работу.
Я разработал код для запуска из командной строки и сохранения веб-данных в файлы.
источник
Вы рассматривали Watir?
http://watir.com/
Когда вы добавили пакет, вы можете запустить его как отдельный файл или
irb
построчно послеinclude 'watir-webdriver'
. Я обнаружил, что он более отзывчивыйselenium-webdriver
, но без графического интерфейса для записи тестов, который помогает разрабатывать сложные условия тестирования.источник