Загрузка изображений с помощью node.js [закрыто]

169

Я пытаюсь написать скрипт для загрузки изображений с помощью node.js. Это то, что я до сих пор:

var maxLength = 10 // 10mb
var download = function(uri, callback) {
  http.request(uri)
    .on('response', function(res) {
      if (res.headers['content-length'] > maxLength*1024*1024) {
        callback(new Error('Image too large.'))
      } else if (!~[200, 304].indexOf(res.statusCode)) {
        callback(new Error('Received an invalid status code.'))
      } else if (!res.headers['content-type'].match(/image/)) {
        callback(new Error('Not an image.'))
      } else {
        var body = ''
        res.setEncoding('binary')
        res
          .on('error', function(err) {
            callback(err)
          })
          .on('data', function(chunk) {
            body += chunk
          })
          .on('end', function() {
            // What about Windows?!
            var path = '/tmp/' + Math.random().toString().split('.').pop()
            fs.writeFile(path, body, 'binary', function(err) {
              callback(err, path)
            })
          })
      }
    })
    .on('error', function(err) {
      callback(err)
    })
    .end();
}

Я, однако, хочу сделать это более надежным:

  1. Есть ли библиотеки, которые делают это и делают это лучше?
  2. Есть ли вероятность того, что заголовки ответа лежат (о длине, о типе контента)?
  3. Есть ли какие-либо другие коды статуса, о которых я должен заботиться? Должен ли я беспокоиться о перенаправлениях?
  4. Я думаю, что где-то читал, что binaryкодировка будет устаревшей. Что мне тогда делать?
  5. Как я могу заставить это работать на окнах?
  6. Есть ли другие способы сделать этот скрипт лучше?

Почему: для функции, похожей на imgur, где пользователи могут дать мне URL, я загружаю это изображение и повторно размещаю изображение в нескольких размерах.

Джонатан Онг
источник

Ответы:

401

Я бы предложил использовать модуль запроса . Скачать файл так же просто, как следующий код:

var fs = require('fs'),
    request = require('request');

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    console.log('content-type:', res.headers['content-type']);
    console.log('content-length:', res.headers['content-length']);

    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', 'google.png', function(){
  console.log('done');
});
Цезарий Войтковски
источник
1
Прохладно! Есть ли способ проверить размер и тип контента перед его фактической загрузкой?
Джонатан Онг
2
Где он загружает изображения в?
Гофилорд
18
Не работает для меня (Изображение повреждено
Дарт
2
@Gofilord его скачать изображение в корневой каталог.
dang
1
Можете ли вы изменить местоположение, где они сохранены? Если вы хотели их в определенной папке?
AKL012
34

Я столкнулся с этой проблемой несколько дней назад, для чистого ответа NodeJS я бы предложил использовать Stream для объединения кусков вместе.

var http = require('http'),                                                
    Stream = require('stream').Transform,                                  
    fs = require('fs');                                                    

var url = 'http://www.google.com/images/srpr/logo11w.png';                    

http.request(url, function(response) {                                        
  var data = new Stream();                                                    

  response.on('data', function(chunk) {                                       
    data.push(chunk);                                                         
  });                                                                         

  response.on('end', function() {                                             
    fs.writeFileSync('image.png', data.read());                               
  });                                                                         
}).end();

Новейшие версии Node не будут хорошо работать с двоичными строками, поэтому объединение фрагментов со строками не является хорошей идеей при работе с двоичными данными.

* Просто будьте осторожны при использовании data.read (), он очистит поток для следующей операции read (). Если вы хотите использовать его более одного раза, храните его где-нибудь.

Нихей Такидзава
источник
7
Почему бы не транслировать загрузку прямо на диск?
Geon
было много проблем с разбивкой строк вместе, так как это создало поврежденный файл, но это было сделано
Shaho
28

Вы можете использовать Axios ( основанный на обещаниях HTTP-клиент для Node.js) для загрузки изображений в выбранном вами порядке в асинхронной среде :

npm i axios

Затем вы можете использовать следующий базовый пример, чтобы начать загрузку изображений:

const fs = require('fs');
const axios = require('axios');

/* ============================================================
  Function: Download Image
============================================================ */

const download_image = (url, image_path) =>
  axios({
    url,
    responseType: 'stream',
  }).then(
    response =>
      new Promise((resolve, reject) => {
        response.data
          .pipe(fs.createWriteStream(image_path))
          .on('finish', () => resolve())
          .on('error', e => reject(e));
      }),
  );

/* ============================================================
  Download Images in Order
============================================================ */

(async () => {
  let example_image_1 = await download_image('https://example.com/test-1.png', 'example-1.png');

  console.log(example_image_1.status); // true
  console.log(example_image_1.error); // ''

  let example_image_2 = await download_image('https://example.com/does-not-exist.png', 'example-2.png');

  console.log(example_image_2.status); // false
  console.log(example_image_2.error); // 'Error: Request failed with status code 404'

  let example_image_3 = await download_image('https://example.com/test-3.png', 'example-3.png');

  console.log(example_image_3.status); // true
  console.log(example_image_3.error); // ''
})();
Грант Миллер
источник
2
Отличный пример! Но едва читаемый код, попробуйте стандартный стиль: D
camwhite
3
@camwhite Я предпочитаю точки с запятой . ;)
Грант Миллер
1
Вы действительно должны прикрепить события 'finish' и 'error' к потоку записи, обернуть их в Promise и вернуть обещание. В противном случае вы можете попытаться получить доступ к изображению, которое еще не было полностью загружено.
jwerre
Разве ожидание не убедится, что изображение полностью загружено, прежде чем пытаться получить к нему доступ? @jwerre
FabricioG
@jwerre @FabricioG Я обновил функцию, download_imageчтобы записывать события 'finish' и 'error' для возвращенного обещания
Beeno Tung
10

если вы хотите прогресс загрузки, попробуйте это:

var fs = require('fs');
var request = require('request');
var progress = require('request-progress');

module.exports = function (uri, path, onProgress, onResponse, onError, onEnd) {
    progress(request(uri))
    .on('progress', onProgress)
    .on('response', onResponse)
    .on('error', onError)
    .on('end', onEnd)
    .pipe(fs.createWriteStream(path))
};

как пользоваться:

  var download = require('../lib/download');
  download("https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png", "~/download/logo.png", function (state) {
            console.log("progress", state);
        }, function (response) {
            console.log("status code", response.statusCode);
        }, function (error) {
            console.log("error", error);
        }, function () {
            console.log("done");
        });

примечание: вы должны установить оба модуля request и request-progress, используя:

npm install request request-progress --save
Фарид Алнамрути
источник
2
Это отлично работало, но хотел предложить добавить statusCodeчек. 500 statusCode, например, не ударит 'on("error", e). Добавление on('response', (response) => console.error(response.statusCode))значительно облегчает отладку,
mateuscb
1
Вы можете отредактировать мой ответ :)
Fareed Alnamrouti
4

Основываясь на вышеизложенном, если кому-то нужно обрабатывать ошибки в потоках записи / чтения, я использовал эту версию. Обратите внимание, что stream.read()в случае ошибки записи, это необходимо, чтобы мы могли завершить чтение и запустить closeпоток чтения.

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    if (err) callback(err, filename);
    else {
        var stream = request(uri);
        stream.pipe(
            fs.createWriteStream(filename)
                .on('error', function(err){
                    callback(error, filename);
                    stream.read();
                })
            )
        .on('close', function() {
            callback(null, filename);
        });
    }
  });
};
VladFr
источник
2
stream.read()кажется устаревшим, выдает ошибкуnot a function
bendulum
4
var fs = require('fs'),
http = require('http'),
https = require('https');

var Stream = require('stream').Transform;

var downloadImageToUrl = (url, filename, callback) => {

    var client = http;
    if (url.toString().indexOf("https") === 0){
      client = https;
     }

    client.request(url, function(response) {                                        
      var data = new Stream();                                                    

      response.on('data', function(chunk) {                                       
         data.push(chunk);                                                         
      });                                                                         

      response.on('end', function() {                                             
         fs.writeFileSync(filename, data.read());                               
      });                                                                         
   }).end();
};

downloadImageToUrl('https://www.google.com/images/srpr/logo11w.png', 'public/uploads/users/abc.jpg');
Чандан Чхаджер
источник
1
Ваша функция не вызывает обратный вызов
crockpotveggies
4

Это продолжение ответа Цезария. Если вы хотите загрузить его в определенный каталог, используйте это. Также используйте const вместо var. Так безопасно.

const fs = require('fs');
const request = require('request');
var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){    
    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', './images/google.png', function(){
  console.log('done');
});
Ахсан Ахмед
источник