Я использую wget --mirror --html-extension --convert-links
для зеркалирования сайта, но я получаю много имен файлов в формате post.php?id=#.html
. Когда я пытаюсь просмотреть их в браузере, происходит сбой, потому что браузер игнорирует строку запроса при загрузке файла. Есть ли способ заменить ?
символ в именах файлов чем-то другим?
Ответ --restrict-file-names=windows
сработал правильно. В сочетании с флагами --convert-links
и --adjust-extension
/ -E
(ранее названным --html-extension
, который также работает, но не рекомендуется), он создает зеркало, которое ведет себя так, как ожидается.
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
будет сохранен как можноarticle.cgi?25.html
найти в разделе 2.7 на gnu.org/software/wget/manual/wget.html#HTTP-OptionsУ wget нет возможности изменить сохраненное имя. Что вам, вероятно, нужно будет сделать, это создать сценарий, чтобы пройти и заменить? с _ или что-то подобное. Один только Wget не может этого сделать.
источник