当我运行我的 ruby 脚本时,这是一个很长的循环系列。对于每个循环,通过 nokogiri 解析一些随机的 html 文件。
top 显示内存消耗百分比随着 CPU 使用率每隔几秒增加 0.1。
最终,ruby 脚本由于“内存不足”而崩溃
更新到最新:
def extract(newdoc, newarray)
doc = Nokogiri::HTML(newdoc)
collection = ''
collection = newarray.map {|s| doc.xpath(s)}
dd = "";
(0...collection.first.length).each do |i|
(0...collection.length).each do |j|
dd += collection[j][i].to_s
end
end
collection = ''
newarray = ''
doc = ''
puts dd.chop + "\n"
end
for 1..100000
extract("somerandomHTMLfile", ["/html/body/p", "/html/body/h1"])
end