我尝试使用以下方法将数据从 mongodb 导入到 r:
mongo.find.all(mongo, namespace, query=query,
fields= list('_id'= 0, 'entityEventName'= 1, context= 1, 'startTime'=1 ), data.frame= T)
该命令适用于小型数据集,但我想导入 1,000,000 个文档。
使用 system.time 并将 limit= X 添加到命令中,我将时间测量为要导入的数据的函数:
system.time(mongo.find.all(mongo, namespace, query=query ,
fields= list('_id'= 0, 'entityEventName'= 1, context= 1, 'startTime'=1 ),
limit= 10000, data.frame= T))
结果:
Data Size Time
1 0.02
100 0.29
1000 2.51
5000 16.47
10000 20.41
50000 193.36
100000 743.74
200000 2828.33
绘制数据后,我相信:Import Time = f( Data^2 )
时间 = -138.3643 + 0.0067807*数据大小 + 6.773e-8*(数据大小-45762.6)^2
R^2 = 0.999997
- 我对么?
- 有更快的命令吗?
谢谢!