7

我们目前正在探索 MongoDB 中的 Capped Collections 和 Tailable Cursors,以创建一个用于通知的排队系统。然而,在创建了一个简单的 LinqPad 测试(下面的代码)之后,我们注意到在运行时,即使我们没有插入任何记录,Mongo 也会不断地分配内存,直到没有更多可用资源。这种分配一直​​持续到所有系统 RAM 都用完为止,此时 Mongo 会停止响应。

由于我们是 Capped Collections 和 Tailable Cursors 的新手,我想确保在提交错误之前我们没有遗漏一些明显的东西。

注意:我们尝试了下面的代码,打开和关闭日志,结果相同。

  • 平台:Windows Server 2012 64bit
  • MongoDB:版本 2.4.8 64 位
  • 驱动:官方C# 10gen v1.8.3.9

Linqpad 脚本

var conn = new MongoClient("mongodb://the.server.url").GetServer().GetDatabase("TestDB");

if(!conn.CollectionExists("Queue")) {

    conn.CreateCollection("Queue", CollectionOptions
        .SetCapped(true)
        .SetMaxSize(100000)
        .SetMaxDocuments(100)
    );

    //Insert an empty document as without this 'cursor.IsDead' is always true
    var coll = conn.GetCollection("Queue");
    coll.Insert(
        new BsonDocument(new Dictionary<string, object> {
            { "PROCESSED", true },
        }), WriteConcern.Unacknowledged
    );
}

var coll = conn.GetCollection("Queue");
var query = coll.Find(Query.EQ("PROCESSED", false))
    .SetFlags(QueryFlags.AwaitData | QueryFlags.NoCursorTimeout | QueryFlags.TailableCursor);

var cursor = new MongoCursorEnumerator<BsonDocument>(query);

while(true) {
    if(cursor.MoveNext()) {
        string.Format(
            "{0:yyyy-MM-dd HH:mm:ss} - {1}",
            cursor.Current["Date"].ToUniversalTime(),
            cursor.Current["X"].AsString
        ).Dump();

        coll.Update(
            Query.EQ("_id", cursor.Current["_id"]),
            Update.Set("PROCESSED", true),
            WriteConcern.Unacknowledged
        );
    } else if(cursor.IsDead) {
        "DONE".Dump();
        break;
    }
}
4

2 回答 2

5

看来我找到了解决问题的方法!!

上述代码中的问题围绕查询:

Query.EQ("PROCESSED", false)

当我删除它并用基于文档 id 的查询替换它时,内存消耗问题就消失了。进一步思考,查询中确实不需要此“已处理”属性,因为 cursor.MoveNext() 将始终返回下一个新文档(如果有的话)。这是基于上述代码重构的 LinqPad 脚本....

var conn = new MongoClient("mongodb://the.server.url").GetServer().GetDatabase("TestDB");

if(conn.CollectionExists("Queue")) {
    conn.DropCollection("Queue");
}

conn.CreateCollection("Queue", CollectionOptions
    .SetCapped(true)
    .SetMaxSize(100000)
    .SetMaxDocuments(100)
    .SetAutoIndexId(true)
);

//Insert an empty document as without this 'cursor.IsDead' is always true
var coll = conn.GetCollection("Queue");
coll.Insert(
    new BsonDocument(new Dictionary<string, object> {
        { "PROCESSED", true },
        { "Date", DateTime.UtcNow },
        { "X", "test" }
    }), WriteConcern.Unacknowledged
);

//Create query based on latest document id
BsonValue lastId = BsonMinKey.Value;
var query = coll.Find(Query.GT("_id", lastId))
    .SetFlags(QueryFlags.AwaitData | QueryFlags.NoCursorTimeout | QueryFlags.TailableCursor);

var cursor = new MongoCursorEnumerator<BsonDocument>(query);

while(true) {
    if(cursor.MoveNext()) {
        string.Format(
            "{0:yyyy-MM-dd HH:mm:ss} - {1}",
            cursor.Current["Date"].ToUniversalTime(),
            cursor.Current["X"].AsString
        ).Dump();
    } else if(cursor.IsDead) {
        "DONE".Dump();
        break;
    }
}
于 2014-04-01T12:38:32.890 回答
0

同样在这里 - 没有那个额外的查询。

经过更多调查(实际上更多),我发现问题看起来像这样:

如果第一个 MoveNext 没有返回记录,则存在问题。查询的类型无关紧要。集合中有多少条目并不重要。

如果您更改返回最后一个条目作为第一个结果的查询,一切正常。你可以丢弃它,因为你已经知道了......

上面的示例成功了,因为您最初获得了集合中已经存在的所有记录。

于 2015-10-23T09:21:08.880 回答