4

首先,一点背景:

我正在尝试检查图像的二进制数据是否已保存在 Mongo 中。给定以下架构:

var mongoose = require('mongoose')
  , Schema = mongoose.Schema;

var imageSchema = new Schema({
    mime:  String,
    bin: { type: Buffer, index: { unique: true }},
    uses : [{type: Schema.Types.ObjectId}]
});

module.exports = mongoose.model('Image', imageSchema);

...我想查询图像是否存在,是否添加了我的对象正在使用它的引用,然后更新它。如果没有,我想创建(更新插入)它。

鉴于它不存在,下面的代码可以完美运行。如果是,则下面的代码不会,并将另一个 Image 文档添加到 Mongo。我觉得这可能是 Mongo Buffer 类型与节点 Buffer 的比较问题,但我不知道如何正确比较它们。请让我知道如何更新以下内容!谢谢!

Image.findOneAndUpdate({
    mime : contentType,
    bin : image
}, {
    $pushAll : {
        uses : [ myObject._id ]
    }
}, {
    upsert : true
}, function(err, image) {
    if (err)
        console.log(err);
    // !!!image is created always, never updated!!!
});
4

3 回答 3

7

Mongoose 将要存储的 Buffer 元素转换为 mongodb Binary,但它在执行查询时会执行适当的强制转换。在单元测试中也会检查预期的行为(也是 node.js 缓冲区的存储和检索)。

您确定要传递 node.js 缓冲区吗?

无论如何,我认为处理初始问题(检查图像是否已经在数据库中)的最佳方法是存储二进制数据的强哈希摘要(sha1,sha256,...)并检查(使用加密模块)。查询时,作为初步测试,您还可以检查二进制长度以避免不必要的计算。

有关如何在存储/查询图像之前获取图像摘要的示例:

var crypto = require('crypto');

...

// be sure image is a node.js Buffer
var image_digest = crypto.createHash('sha256');
image_digest.update(image);
image_digest = image_digest.digest('base64');
于 2013-09-24T07:42:11.287 回答
0

哈希确实有效,我使用的另一个过滤器是图像的 exif 数据。由于这是结构化信息,如果您在 exif 数据上有匹配项,则可以进入下一步检查哈希或文件大小的匹配项...

大量节点模块,可轻松轻松地为您的存储获取 exif 数据 :) 获取节点的 exif 数据的示例代码

于 2013-12-26T10:36:54.640 回答
0

通过包含图像数据的 node.js 缓冲区查询您的图像不是一个好主意。没错,这可能是 BSON 二进制数据类型和节点缓冲区之间的问题,但是您的应用程序真的需要这样的比较吗?

相反,我会在您的架构中添加一个 imageID 或 slug 字段,向该字段添加一个索引,然后查询它而不是bin在您的findOneAndUpdate调用中:

var imageSchema = new Schema({
    imageID: { type: String, index: { unique: true }},
    mime:  String,
    bin: Buffer,
    uses : [{type: Schema.Types.ObjectId}]
});
于 2013-09-20T20:19:30.803 回答