1

我有一个包含多个日期类型字段的集合。我知道我可以根据它们的键更改它们,但是有没有办法找到所有具有日期作为类型的字段并在一个脚本中更改所有这些字段?

更新

非常感谢chridam帮助我。根据他的代码,我想出了这个解决方案。(注意:我有 mongo 3.2.9,chridam 的答案中的一些代码片段无法运行。它可能有效,但对我不起作用。)

map = function() {
    for (var key in this) { 
        if (key != null && this[key] != null && this[key] instanceof Date){ 
            emit(key, null); 
        }
    }
}

collectionName = "testcollection_copy";

mr = db.runCommand({
    "mapreduce": collectionName,
    "map": map,  
    "reduce": function() {},
    "out": "map_reduce_test" // out is required
}) 

dateFields = db[mr.result].distinct("_id")
printjson(dateFields)

//updating documents
db[collectionName].find().forEach(function (document){
   for(var i=0;i<dateFields.length;i++){
       document[dateFields[i]] = new NumberLong(document[dateFields[i]].getTime());
   } 
   db[collectionName].save(document);
});

由于投影不起作用,我使用上面的代码来更新文档。我唯一的问题是为什么要使用 bulkWrite?

(此外, getTime() 似乎比减去日期更好。)

4

1 回答 1

1

像这样的操作将涉及两个任务;一个是通过获取日期类型的字段列表,MapReduce另一个是通过聚合或Bulk写入操作更新集合。

注意:以下方法假设所有日期字段都位于文档的根级别,而不是嵌入或子文档。

MapReduce

您需要做的第一件事是运行以下mapReduce操作。这将帮助您确定集合中每个文档的每个属性是否都是日期类型并返回日期字段的不同列表:

// define helper function to determine if a key is of Date type
isDate = function(dt) {
    return dt && dt instanceof Date && !isNaN(dt.valueOf());
}

// map function
map = function() {
    for (var key in this) { 
        if (isDate(value[key]) 
            emit(key, null); 
    }
}

// variable with collection name
collectionName = "yourCollectionName";

mr = db.runCommand({
    "mapreduce": collectionName,
    "map": map,  
    "reduce": function() {}
}) 

dateFields = db[mr.result].distinct("_id")
printjson(dateFields)

//output: [ "validFrom", "validTo", "registerDate"" ]

选项 1:通过聚合框架更新集合

您可以使用聚合框架来更新您的集合,特别是$addFieldsMongoDB 版本 3.4 和更高版本中可用的运算符。如果您的 MongoDB 服务器版本不支持此功能,您可以使用其他解决方法更新您的集合(如下一个选项中所述)。

时间戳是使用$subtract算术聚合运算符计算的,其中日期字段为被减数,自纪元以来的日期为被new Date("1970-01-01")减数。

然后,聚合管道的结果文档通过运算符写入同一个集合,$out从而使用新字段更新集合。

本质上,您最终希望运行以下聚合管道,该管道使用上述算法将日期字段转换为时间戳:

pipeline = [
    {
        "$addFields": {
            "validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
            "validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
            "registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
        }
    },
    { "$out": collectionName }
]
db[collectionName].aggregate(pipeline)

给定日期字段列表,您可以动态创建上述管道数组,如下所示:

var addFields = { "$addFields": { } },
    output = { "$out": collectionName };

dateFields.forEach(function(key){
    var subtr = ["$"+key, new Date("1970-01-01")];
    addFields["$addFields"][key] = { "$subtract": subtr };
});

db[collectionName].aggregate([addFields, output])

选项 2:通过批量更新集合

由于此选项是$addFields不支持上述运算符时的一种解决方法,因此您可以使用$project管道创建具有相同$subtract实现的新时间戳字段,但不是将结果写入同一个集合,您可以使用从聚合结果中迭代游标forEach()方法和每个文档,使用该bulkWrite()方法更新集合。

以下示例显示了这种方法:

ops = []
pipeline = [
    {
        "$project": {
            "validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
            "validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
            "registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
        }
    }
]

db[collectionName].aggregate(pipeline).forEach(function(doc) {
    ops.push({
        "updateOne": {
            "filter": { "_id": doc._id },
            "update": {
                "$set": { 
                    "validFrom": doc.validFrom,
                    "validTo": doc.validTo,
                    "registerDate": doc.registerDate
                }
            }
        }
    });

    if (ops.length === 500 ) {
        db[collectionName].bulkWrite(ops);
        ops = [];
    }
})

if (ops.length > 0)  
    db[collectionName].bulkWrite(ops);

使用与上面选项 1相同的方法来动态创建管道和批量方法对象:

var ops = [],
    project = { "$project": { } },

dateFields.forEach(function(key){
    var subtr = ["$"+key, new Date("1970-01-01")];
    project["$project"][key] = { "$subtract": subtr };
});

setDocFields = function(doc, keysList) { 
    setObj = { "$set": { } };
    return keysList.reduce(function(obj, key) {  
        obj["$set"][key] = doc[key];
        return obj;
    }, setObj )
}

db[collectionName].aggregate([project]).forEach(function(doc) {
    ops.push({
        "updateOne": {
            "filter": { "_id": doc._id },
            "update": setDocFields(doc, dateFields)
        }
    });

    if (ops.length === 500 ) {
        db[collectionName].bulkWrite(ops);
        ops = [];
    }
})

if (ops.length > 0)  
    db[collectionName].bulkWrite(ops);
于 2017-01-04T10:02:06.747 回答