Обновить поле MongoDB, используя значение другого поля

372

В MongoDB возможно ли обновить значение поля, используя значение из другого поля? Эквивалентный SQL будет что-то вроде:

UPDATE Person SET Name = FirstName + ' ' + LastName

И псевдокод MongoDB будет:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
Крис Фулстоу
источник

Ответы:

260

Лучший способ сделать это в версии 4.2+ , которая позволяет использовать агрегирование трубопровода в документе обновлений и updateOne, updateManyили updateметод сбора. Обратите внимание, что последний устарел в большинстве, если не во всех драйверах языков.

MongoDB 4.2+

Версия 4.2 также представила $setоператор стадии конвейера, который является псевдонимом для $addFields. Я буду использовать $setздесь, поскольку он сопоставляет то, что мы пытаемся достичь.

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

MongoDB 3.4+

В 3.4+ можно использовать $addFieldsи $outоператоры агрегации трубопроводов.

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

Обратите внимание, что это не обновляет вашу коллекцию, а заменяет существующую коллекцию или создает новую. Также для операций обновления, которые требуют «приведения типов», вам потребуется обработка на стороне клиента, и в зависимости от операции вам может потребоваться использовать find()метод вместо .aggreate()метода.

MongoDB 3.2 и 3.0

Для этого мы используем $projectнаши документы и используем $concatоператор агрегирования строк для возврата объединенной строки. Оттуда вы затем перебираете курсор и используете $setоператор обновления, чтобы добавить новое поле в ваши документы, используя массовые операции для максимальной эффективности.

Запрос агрегации:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2 или новее

Исходя из этого, вам нужно использовать bulkWriteметод.

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6 и 3.0

В этой версии вам нужно использовать устаревший BulkAPI и связанные с ним методы .

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})
styvane
источник
Я думаю, что есть проблема с кодом для "MongoDB 3.2 или новее". Поскольку forEach является асинхронным, обычно ничего не пишется в последнем массовом письме.
Виктор Хедефальк
3
4.2+ не работает. MongoError: Недопустимое поле $ concat с префиксом доллара ($) в «name. $ Concat» недопустимо для хранения.
Джош Вудкок
@JoshWoodcock, я думаю, что у вас была опечатка в запросе, который вы выполняете. Я предлагаю вам дважды проверить.
Styvane
@JoshWoodcock Это прекрасно работает. Пожалуйста, проверьте это с помощью MongoDB Web Shell
Styvane
2
Для тех, кто столкнулся с той же проблемой, описанной @JoshWoodcock: обратите внимание, что ответ для 4.2+ описывает конвейер агрегации , поэтому не пропустите квадратные скобки во втором параметре!
Филш
240

Вы должны пройти через. Для вашего конкретного случая:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);
Карлос Барселона
источник
4
Что произойдет, если другой пользователь изменил документ между вашим find () и вашим save ()?
UpTheCreek,
3
Верно, но копирование между полями не должно требовать, чтобы транзакции были атомарными.
UpTheCreek
3
Важно отметить, что save()полностью заменяет документ. Следует использовать update()вместо.
Карлос
12
Как насчетdb.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
Филипп Jardas
1
Я создал функцию с именем, create_guidкоторая генерирует уникальный guid для каждого документа при итерации forEachтаким способом (т. Е. Простое использование create_guidв updateоператоре with mutli=trueпривело к созданию одинакового guid для всех документов). Этот ответ отлично сработал для меня. +1
rmirabelle
103

Видимо, есть способ сделать это эффективно, начиная с MongoDB 3.4, см . Ответ стивейна .


Устаревший ответ ниже

Вы не можете ссылаться на сам документ в обновлении (пока). Вам нужно будет перебирать документы и обновлять каждый документ с помощью функции. Посмотрите этот ответ для примера, или этот для серверной стороны eval().

Нильс ван дер Рест
источник
31
Это все еще актуально сегодня?
Кристиан Энгель
3
@ChristianEngel: Кажется, так. Я не смог найти ничего в документах MongoDB, где упоминается ссылка на текущий документ в updateоперации. Этот связанный запрос по-прежнему не решен.
Нильс ван дер Рест
4
Это все еще действует в апреле 2017 года? Или уже есть новые функции, которые могут это сделать?
Ким
1
@ Ким Похоже, это все еще в силе. Кроме того, запрос функции, на который @ niels-van-der-rest указал еще в 2013 году, все еще находится в процессе OPEN.
Данцигер
8
это больше не правильный ответ, посмотрите ответ
@styvane
45

Для базы данных с высокой активностью вы можете столкнуться с проблемами, когда ваши обновления влияют на активно меняющиеся записи, и по этой причине я рекомендую использовать snapshot ()

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/

Эрик Кигати
источник
2
Что произойдет, если другой пользователь отредактировал человека между find () и save ()? У меня есть случай, когда несколько вызовов могут быть сделаны к одному и тому же объекту, меняя их в зависимости от их текущих значений. Второму пользователю следует подождать с чтением, пока первый не завершит сохранение. Это делает это?
Марко
4
О snapshot(): Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead. ссылка
ppython
10

Что касается этого ответа , функция снимка устарела в версии 3.6, согласно этому обновлению . Итак, на версии 3.6 и выше, можно выполнить операцию следующим образом:

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);
Aldo
источник
9

Начав Mongo 4.2, db.collection.update()можно принять агрегационный конвейер, наконец, разрешив обновление / создание поля на основе другого поля:

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • Первая часть {}- это запрос на совпадение, который фильтрует какие документы обновлять (в нашем случае все документы).

  • Вторая часть [{ $set: { name: { ... } }]- конвейер агрегации обновлений (обратите внимание на квадратные скобки, обозначающие использование конвейера агрегации). $setэто новый оператор агрегирования и псевдоним $addFields.

  • Не забывайте { multi: true }, иначе будет обновлен только первый соответствующий документ.

Ксавье Гихот
источник
8

Я пробовал вышеуказанное решение, но оказалось, что оно не подходит для больших объемов данных. Затем я обнаружил функцию потока:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})
Крис Гибб
источник
1
Чем это отличается? Будет ли пар задушен активностью обновления? Есть ли у вас какие-либо ссылки на это? Документы Mongo довольно бедны.
Нико
2

Вот что мы придумали для копирования одного поля в другое для ~ 150_000 записей. Это заняло около 6 минут, но все еще значительно менее требовательно к ресурсам, чем это было бы для создания экземпляра и повторения одного и того же числа объектов ruby.

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
Крис Блум
источник
1

С MongoDB версии 4.2+ , обновления являются более гибкими , поскольку это позволяет использовать агрегацию трубопровода в ее update, updateOneи updateMany. Теперь вы можете трансформировать ваши документы с помощью операторов агрегирования, а затем обновлять без необходимости подробно описывать $setкоманду (вместо этого мы используем$replaceRoot: {newRoot: "$$ROOT"} )

Здесь мы используем агрегированный запрос для извлечения метки времени из поля «_id» ObjectID MongoDB и обновления документов (я не эксперт по SQL, но я думаю, что SQL не предоставляет автоматически сгенерированный ObjectID с меткой времени, вам придется автоматически создать эту дату)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})
И Сян Чонг
источник
Вам не нужно { $replaceRoot: { newRoot: "$$ROOT" } }; это означает замену документа самим по себе, что бессмысленно. Если заменить $addFieldsего псевдоним $setи updateManyкоторый является одним из псевдонимов update, то вы получите точно такой же ответ , как эта выше.
Ксавье Гихот