3

我正在使用 MongoDB do 在 R 中勾选数据分析。最初我使用 MySQL,它运行良好,但我想为此目的测试 MongoDB。该数据集目前包含大约 2 亿个条目。使用 RODBC,我可以非常快速地将查询结果放入 data.frame 中sqlQuery(conn, "select * from td where prd = 'TY' and date = '2012-01-03'")

在 MongoDB 我有像Document{{_id=5537ca647a3ad42a84374f0a, prd=TY, time=1325661600043, px=130.6875, sz=11}}

在 Java 中,我可以检索一天的刻度数据 - 大约 100,000 个条目,创建 Tick 对象并将它们添加到数组中,所有这些都在不到 2 秒的时间内完成。

使用 rmongodb,下面需要永远。任何想法如何改善这一点?

query <- mongo.bson.from.list( list(product = "TY", date = as.POSIXct("2012-01-04")) )
res.cursor <- mongo.find(mongo, db.coll, query, limit = 100e3, options=mongo.find.exhaust)
resdf <- mongo.cursor.to.data.frame(res.cursor)

使用find.all同样慢。

4

0 回答 0