Wget перезаписывает файлы при зеркалировании многоязычного сайта

1

Я хотел бы отразить сайт с помощью wget. Проблема в том, что на сайте есть несколько языковых мутаций, которые переключаются с помощью параметра строки запроса, и когда wget начинает загружать версию на другом языке, она забивает предыдущую. Например, он начинается с index.html, захватывает часть сайта, затем обнаруживает ссылку на index.html? Lang = foo, начинает загрузку нового варианта языка и перезаписывает предыдущий index.html новым. Что я могу сделать, когда я хочу их всех?

Zoul
источник

Ответы:

1

Поскольку страницы на самом деле одинаковы, я не слишком уверен ...

Вы можете попробовать HTTrack, который является очень гибким копиром веб-сайта, и вы можете настроить правила, такие как исключение путей / страниц с определенной строкой запроса ... Или он может на самом деле иметь возможность загружать все языки, я не уверен на 100%, так как у меня есть не столкнуться с этой проблемой.

Уильям Хилсум
источник
Это помогло, спасибо. Похоже, я смогу скачать сайт по одному языку за раз и исключить ссылки, которые ведут на другой.
zoul