32

我正在阅读一些关于 Java 垃圾收集的材料,以便更深入地了解 GC 过程中真正发生的事情。

我遇到了一种叫做“牌桌”的机制。我已经用谷歌搜索了它,但没有找到全面的信息。大多数解释都相当肤浅,并且像魔术一样描述它。

我的问题是:卡片表和写屏障如何工作?牌桌上有什么标记?那么垃圾收集器如何知道特定对象被老一代中持久存在的另一个对象引用。

我想对那个机制有一些实际的想象,就像我应该准备一些模拟一样。

4

3 回答 3

42

不知道你是不是发现了一些特别糟糕的描述,还是你期望的细节太多,我对我看到的解释已经很满意了。如果描述简短且听起来简单,那是因为它确实是一个相当简单的机制。

正如您显然已经知道的那样,分代垃圾收集器需要能够枚举引用年轻对象的旧对象。扫描所有旧对象是正确的,但这会破坏分代方法的优势,因此您必须缩小范围。不管你怎么做,你都需要一个写屏障——每当分配/写入成员变量(引用类型)时执行的一段代码。如果新的引用指向一个年轻的对象并且它被存储在一个旧的对象中,那么写屏障会为垃圾收集记录这个事实。不同之处在于它的记录方式。有一些使用所谓的记忆集的精确方案,即每个旧对象的集合,这些旧对象具有(在某些时候)对年轻对象的引用。可以想象,这需要相当多的空间。

卡片表是一种权衡:它不会告诉您哪些对象确切包含年轻指针(或至少在某些时候确实包含),而是将对象分组到固定大小的桶中并跟踪哪些桶包含具有年轻指针的对象。当然,这减少了空间使用。为了正确起见,您如何存储对象并不重要,只要您对此保持一致即可。为了提高效率,您只需将它们按内存地址分组(因为您可以免费使用),除以更大的 2 次幂(使除法成为廉价的按位运算)。

此外,您无需维护明确的存储桶列表,而是预先为每个可能的存储桶预留一些空间。具体来说,有一个由 N 位或字节组成的数组,其中 N 是桶的数量,因此如果第th 桶不包含年轻指针,i则值为 0,如果包含年轻指针,则值为 1。i这是正确的牌桌。通常,该空间与用作堆(一部分)的大块内存一起分配和释放。如果不需要增长,它甚至可以嵌入到内存块的开头。除非将整个地址空间用作堆(这是非常罕见的),否则上面的公式给出的数字是从 0 开始start_of_memory_region >> K而不是从 0 开始,因此要获得卡表的索引,您必须减去堆的起始地址的开始。

总之,当写屏障发现语句some_obj.field = other_obj;将年轻指针存储在旧对象中时,它会这样做:

card_table[(&old_obj - start_of_heap) >> K] = 1;

&old_obj现在具有年轻指针的对象的地址在哪里(它已经在寄存器中,因为它刚刚确定要引用旧对象)。在 Minor GC 期间,垃圾收集器查看卡表以确定要扫描哪些堆区域以查找年轻指针:

for i from 0 to (heap_size >> K):
    if card_table[i]:
        scan heap[i << K .. (i + 1) << K] for young pointers
于 2013-10-03T09:22:57.287 回答
20

前段时间我写了一篇文章,解释 HotSpot JVM 中的年轻收集机制。 理解 JVM 中的 GC 暂停,HotSpot 的次要 GC

脏卡写屏障的原理很简单。每次程序修改内存中的引用时,都应该将修改后的内存页标记为脏页。JVM 中有一个特殊的卡表,每个 512 字节的内存页都关联了卡表中的一个字节条目。

通常收集从旧空间到年轻空间的所有引用需要扫描旧空间中的所有对象。这就是为什么我们需要写屏障。自上次重置写屏障以来,年轻空间中的所有对象都已创建(或重定位),因此非脏页不能引用年轻空间。这意味着我们只能扫描脏页中的对象。

于 2013-10-04T04:25:17.723 回答
13

对于任何正在寻找简单答案的人:

在JVM中,对象的内存空间被分解为两个空间:

  • 年轻代(空间):所有新的分配(对象)都在这个空间内创建。
  • 老一代(空间):这是长寿对象存在的地方(可能会死)

这个想法是,一旦一个对象在几次垃圾回收中存活下来,它更有可能存活很长时间。因此,在垃圾回收中存活超过阈值的对象将被提升到老年代。垃圾收集器在年轻代运行的频率更高,而在老年代运行的频率更低。这是因为大多数对象的寿命都很短。

我们使用分代垃圾收集来避免扫描整个内存空间(如 Mark and Sweep 方法)。在 JVM 中,我们有一个次要垃圾收集,即 GC 在年轻代内部运行时,以及一个主要垃圾收集(或完整 GC),包括年轻代和老年代的垃圾收集。

在进行次要垃圾收集时,JVM 会跟踪从活动根到年轻代对象的每个引用,并将这些对象标记为活动,从而将它们排除在垃圾收集过程之外。问题是老年代的对象可能对年轻一代的对象有一些引用,这应该被GC考虑,这意味着那些被老年代的对象引用的年轻一代的对象也应该被标记为活的并从垃圾收集过程中排除。

解决这个问题的一种方法是扫描老一代中的所有对象并找到它们对年轻对象的引用。但是这种方法与分代垃圾收集器的想法相矛盾。(为什么我们首先将我们的记忆空间分解成多代?)

另一种方法是使用写屏障和卡表。当老一代中的对象写入/更新对年轻一代中对象的引用时,此操作会通过称为写屏障的东西。当 JVM 看到这些写屏障时,它会更新卡表中的相应条目。卡表是一张表,它的每一项对应内存的512字节。0您可以将其视为包含和1项的数组。条目意味着在内存的1相应区域中有一个对象,其中包含对年轻代对象的引用。

现在,当发生次要垃圾回收时,首先从活动根到年轻对象的每个引用都会被跟踪,并且年轻代中的引用对象将被标记为活动。然后,不是扫描所有旧对象以查找对年轻对象的引用,而是扫描卡表。如果 GC 在卡表中找到任何标记区域,它会加载相应的对象并遵循其对年轻对象的引用并将它们标记为活动的。

于 2018-07-18T21:54:20.560 回答