2

我正在用 C++ 编写一个用于编程语言的 VM。该语言是垃圾收集的,因此我在垃圾收集堆中分配了 C++ 类的实例。我正在使用复制收集器,因此当发生 GC 时,这些对象会在内存中移动。这意味着需要更新指向该对象的每个指针。这些指针中的大多数都很容易处理,除了一个棘手的指针:this. 考虑:

class SomeObj : public Managed      // inheriting from this means it's on the GC heap
{
public:
  void method()
  {
    SomeObj* other = new SomeObj(); // could trigger a GC.
    printf("%d\n", someField);      // this points to wrong memory
  }

private:
  int someField;
};

如果我处于 GC 堆上的某个对象的实例方法的中间,则this指向一些 GC 内存。在此方法的中间可能会发生集合。发生这种情况时,对象将被移动到新位置。但是,由于我们处于方法调用的中间,this仍然指向旧的错误位置。

我可以通过不在托管内存中的类上使用实例方法来解决这个问题,但我确实喜欢这样代码更简单。有什么技术可以解决这个问题吗?

4

2 回答 2

2

您的 GC 需要扫描堆栈和寄存器以查找指针并修复它们。如果您的 VM 支持多线程,则需要在扫描其堆栈时暂停所有线程。“this”指针将位于堆栈或寄存器中。

由于 C++ 不提供堆栈的类型信息,因此您可能很难处理类似

int i = 1000000;
char * p = new char[10]; // 0xF4240 = 1000000

无论您使用什么方法来移动其他指针,都会遇到同样的问题。在某些时候,您的代码必须将句柄转换为指针,并且需要修复这些指针。

像这样更改 C++ 代码

func()->method()

看起来像

struct GCroot call123 = { func() };
call123.obj->method();

多线程问题。如果你有这样的代码

struct GCroot obj123 = { /* .. */ };
obj123.ptr->x = obj123.ptr->x + 1;

它可能会生成这样的伪汇编代码

load r1, obj123.ptr
load r2, (r1)
add r2, 1
store (r1), r2

如果另一个线程在第一行和最后一行 asm 之间随时进行 GC,r1 如何修复?

于 2013-04-28T12:36:34.127 回答
1

您可以引入另一个级别的间接性。我会用你的例子:

class SomeData : public Managed
{
 int someField;
};

class SomeObj : public Managed      // inheriting from this means it's on the GC heap
{
public:
  void method()
  {
    SomeObj* other = new SomeObj(); // could trigger a GC.
    printf("%d\n", someData->someField);      // this points to wrong memory
  }

private:
  SomeObjData* someData;
};

请注意,托管的每个实现都会这样做。

于 2013-04-27T22:42:01.847 回答