似乎在 Ruby 中一遍又一遍地解析同一个 JSON 文件会占用越来越多的内存。考虑下面的代码和输出:
- 为什么第一次迭代后内存没有释放?
- 为什么一个 116MB 的 JSON 文件解析后会占用 1.5Gb 的 RAM?考虑到文本文件被转换为哈希值,这令人惊讶。我在这里想念什么?
代码:
require 'json'
def memused
`ps ax -o pid,rss | grep -E "^[[:space:]]*#{$$}"`.strip.split.map(&:to_i)[1]/1024
end
text = IO.read('../data-grouped/2012-posts.json')
puts "before parsing: #{memused}MB"
iter = 1
while true
items = JSON.parse(text)
GC.start
puts "#{iter}: #{memused}MB"
iter += 1
end
输出:
before parsing: 116MB
1: 1840MB
2: 2995MB
3: 2341MB
4: 3017MB
5: 2539MB
6: 3019MB