При использовании wget
в сценарии для загрузки некоторых файлов из Google Docs имя файла не сохраняется. Например:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
сохраняет файл как pub?key=pyj6tScZqmEfbZyl0qjbiRQ
вместо того indicatorhivestimatedprevalence15-49.xls
, что я получаю, если нажимаю на ссылку в браузере. Есть ли способ заставить это "браузерное" поведение в wget
?
Вы можете попробовать использовать curl для загрузки и сохранения оригинального имени файла:
см. параметры командной строки curl .
источник
Ссылка Google Docs на самом деле говорит о том, что скрипт на сервере должен быть запущен, анализируя его в нужном вам файле. Насколько мне известно, файл никогда не существует на сервере в форме els, но генерируется во время выполнения, когда вы запрашиваете его. Таким образом, Wget ничего не может получить.
Чтобы загрузить файл, вам нужно будет использовать Google API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/ .
источник
.xls
файл на лету. Тем не менее, полноценный браузер не имеет проблем с этим. Таким образом, очевидно, что можно обойтись без Docs API.