4

为什么unused_variable_2 和unused_variable_3 会被垃圾回收,但unused_variable_1 不会?

# leaky_boat.rb
require "memprof"

class Boat
  def initialize(string)
    unused_variable1 = string[0...100]
    puts unused_variable1.object_id
    @string = string
    puts @string.object_id
  end
end

class Rocket
  def initialize(string)
    unused_variable_2 = string.dup
    puts unused_variable_2.object_id
    unused_variable_3 = String.new(string)
    puts unused_variable_3.object_id
    @string = string
    puts @string.object_id
  end
end

Memprof.start

text = "a" * 100
object_id_message = "Object ids of unused_variable_1, @string, unused_variable_2, unused_variable_3, and another @string"
before_gc_message = "Before GC"
after_gc_message = "After GC"
puts object_id_message
boat = Boat.new(text)
rocket = Rocket.new(text)
puts before_gc_message
Memprof.stats
ObjectSpace.garbage_collect
puts after_gc_message
Memprof.stats
Memprof.stop

运行程序:

$ uname -a
Linux [redacted] 3.2.0-25-generic #40-Ubuntu SMP Wed May 23 20:30:51 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux
$ ruby --version # Have to use Ruby 1.8 - memprof doesn't work on 1.9
ruby 1.8.7 (2011-06-30 patchlevel 352) [x86_64-linux]
$ ruby -rubygems leaky_boat.rb 
Object ids of unused_variable_1, @string, unused_variable_2, unused_variable_3, and another @string
70178323299180
70178323299320
70178323299100
70178323299060
70178323299320
Before GC
      2 leaky_boat.rb:6:String
      2 leaky_boat.rb:26:String
      1 leaky_boat.rb:9:String
      1 leaky_boat.rb:7:String
      1 leaky_boat.rb:32:Rocket
      1 leaky_boat.rb:31:Boat
      1 leaky_boat.rb:29:String
      1 leaky_boat.rb:28:String
      1 leaky_boat.rb:27:String
      1 leaky_boat.rb:20:String
      1 leaky_boat.rb:18:String
      1 leaky_boat.rb:17:String
      1 leaky_boat.rb:16:String
      1 leaky_boat.rb:15:String
After GC
      1 leaky_boat.rb:6:String
      1 leaky_boat.rb:32:Rocket
      1 leaky_boat.rb:31:Boat
      1 leaky_boat.rb:29:String
      1 leaky_boat.rb:28:String
      1 leaky_boat.rb:27:String
      1 leaky_boat.rb:26:String
4

1 回答 1

7

这种行为是因为您的 ruby​​ for substr 版本的字符串实现有一个特殊情况来节省内存分配,当您采用作为源字符串尾部的 substr 并且字符串长度足够大而不能将字符串值存储在基础对象结构。

如果您跟踪代码,您会看到范围下标string[0...100]将通过rb_str_substr 中的此子句。因此,新字符串将通过str_new3分配,它分配一个新的对象结构(因此不同的 object_id),但将字符串值ptr字段设置为指向源对象的扩展存储的指针,并设置ELTS_SHARED标志以指示新对象与另一个对象。

在您的代码中,您获取这个新的子字符串对象并将其分配给实例 var @string,当您运行垃圾收集时,它仍然是一个实时引用。由于对原始字符串的分配存储有实时引用,因此无法收集它。

在 ruby​​ 主干中,这种在兼容的尾子字符串上共享存储的优化似乎仍然存在。

另外两个 varunused_variable_2unused_variable_3没有这种扩展存储共享问题,因为它们是通过确保不同存储的机制设置的,因此当它们的引用超出范围时,它们会按预期进行垃圾收集。

String#dup 运行rb_str_replace(通过initialize_copy 绑定),它将源字符串的内容替换为源字符串内容的副本,并确保不共享存储。

String#new(source_str) 通过rb_str_init运行,它同样确保在提供的初始值上使用 rb_str_replace 进行不同的存储。

于 2012-06-14T20:31:46.320 回答