3

我正在从集合中获取所有行,并在第 100 行遇到延迟。我知道 find 方法会返回游标,而不是所有数据都预先并且在某些时候需要获取更多数据。但是第 100 行是唯一的延迟。

Checking images 99
Checking image 100
*pause*
Checking image 101

然后在没有可见延迟的情况下达到 100 000 张图像。

使用红宝石脚本:

require 'mongo'

time_start = Time.now

mongo = Mongo::MongoClient.new("localhost", 27017)

db = mongo["pics"]

images = db["images"]
albums = db["albums"]

orphans = []

images.find().each do |row|
    puts "Checking image #{row['_id']}"
end

# puts orphans
time_end = Time.now
puts "Total time taken: #{time_end - time_start}"

使用的图像集合 (json)

mongoimport --db pics --collection images file_name

问题是:

  • 一些数据是否与初始光标一起出现?
  • 为什么第 100 行的唯一延迟?也许我错过了一些东西,但那时我什至没有看到 IO 读取

谢谢

4

1 回答 1

4

MongoDB 游标的默认“批量大小”是 100 个对象。意味着 MongoDB 在获取下一批之前获取 100 个对象……这就是您看到延迟的原因。所有驱动程序都应该在光标对象上提供一个方法“batch_size()”或类似的方法来设置和检索批量大小。

于 2012-12-17T10:48:05.843 回答