像这样的操作将涉及两个任务;一个是通过获取日期类型的字段列表,MapReduce
另一个是通过聚合或Bulk
写入操作更新集合。
注意:以下方法假设所有日期字段都位于文档的根级别,而不是嵌入或子文档。
MapReduce
您需要做的第一件事是运行以下mapReduce
操作。这将帮助您确定集合中每个文档的每个属性是否都是日期类型并返回日期字段的不同列表:
// define helper function to determine if a key is of Date type
isDate = function(dt) {
return dt && dt instanceof Date && !isNaN(dt.valueOf());
}
// map function
map = function() {
for (var key in this) {
if (isDate(value[key])
emit(key, null);
}
}
// variable with collection name
collectionName = "yourCollectionName";
mr = db.runCommand({
"mapreduce": collectionName,
"map": map,
"reduce": function() {}
})
dateFields = db[mr.result].distinct("_id")
printjson(dateFields)
//output: [ "validFrom", "validTo", "registerDate"" ]
选项 1:通过聚合框架更新集合
您可以使用聚合框架来更新您的集合,特别是$addFields
MongoDB 版本 3.4 和更高版本中可用的运算符。如果您的 MongoDB 服务器版本不支持此功能,您可以使用其他解决方法更新您的集合(如下一个选项中所述)。
时间戳是使用$subtract
算术聚合运算符计算的,其中日期字段为被减数,自纪元以来的日期为被new Date("1970-01-01")
减数。
然后,聚合管道的结果文档通过运算符写入同一个集合,$out
从而使用新字段更新集合。
本质上,您最终希望运行以下聚合管道,该管道使用上述算法将日期字段转换为时间戳:
pipeline = [
{
"$addFields": {
"validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
"validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
"registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
}
},
{ "$out": collectionName }
]
db[collectionName].aggregate(pipeline)
给定日期字段列表,您可以动态创建上述管道数组,如下所示:
var addFields = { "$addFields": { } },
output = { "$out": collectionName };
dateFields.forEach(function(key){
var subtr = ["$"+key, new Date("1970-01-01")];
addFields["$addFields"][key] = { "$subtract": subtr };
});
db[collectionName].aggregate([addFields, output])
选项 2:通过批量更新集合
由于此选项是$addFields
不支持上述运算符时的一种解决方法,因此您可以使用$project
管道创建具有相同$subtract
实现的新时间戳字段,但不是将结果写入同一个集合,您可以使用从聚合结果中迭代游标forEach()
方法和每个文档,使用该bulkWrite()
方法更新集合。
以下示例显示了这种方法:
ops = []
pipeline = [
{
"$project": {
"validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
"validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
"registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
}
}
]
db[collectionName].aggregate(pipeline).forEach(function(doc) {
ops.push({
"updateOne": {
"filter": { "_id": doc._id },
"update": {
"$set": {
"validFrom": doc.validFrom,
"validTo": doc.validTo,
"registerDate": doc.registerDate
}
}
}
});
if (ops.length === 500 ) {
db[collectionName].bulkWrite(ops);
ops = [];
}
})
if (ops.length > 0)
db[collectionName].bulkWrite(ops);
使用与上面选项 1相同的方法来动态创建管道和批量方法对象:
var ops = [],
project = { "$project": { } },
dateFields.forEach(function(key){
var subtr = ["$"+key, new Date("1970-01-01")];
project["$project"][key] = { "$subtract": subtr };
});
setDocFields = function(doc, keysList) {
setObj = { "$set": { } };
return keysList.reduce(function(obj, key) {
obj["$set"][key] = doc[key];
return obj;
}, setObj )
}
db[collectionName].aggregate([project]).forEach(function(doc) {
ops.push({
"updateOne": {
"filter": { "_id": doc._id },
"update": setDocFields(doc, dateFields)
}
});
if (ops.length === 500 ) {
db[collectionName].bulkWrite(ops);
ops = [];
}
})
if (ops.length > 0)
db[collectionName].bulkWrite(ops);