19

有人知道发现智能指针引起的内存泄漏的“技术”吗?我目前正在开发一个用C++编写的大型项目,该项目大量使用带有引用计数的智能指针。显然,我们有一些由智能指针引起的内存泄漏,它们仍然在代码中的某处被引用,因此它们的内存不会被释放。很难找到带有“不必要”引用的代码行,这会导致相应的对象不被释放(尽管它不再使用)。

我在网上找到了一些建议,建议收集引用计数器的递增/递减操作的调用堆栈。这给了我一个很好的提示,哪段代码导致引用计数器增加或减少。

但我需要的是某种算法,将相应的“增加/减少调用堆栈”组合在一起。删除这对调用堆栈后,我希望(至少)剩下一个“增加调用堆栈”,它向我展示了带有“不必要”引用的代码段,导致相应的对象未被释放。现在修复泄漏没什么大不了的!

但是有人对进行分组的“算法”有想法吗?

开发在Windows XP下进行。

(我希望有人理解,我试图解释的......)

编辑:我说的是循环引用引起的泄漏。

4

12 回答 12

18

请注意,引用计数智能指针的泄漏源之一是具有循环依赖关系的指针。例如,A 有一个指向 B 的智能指针,B 有一个指向 A 的智能指针。A 和 B 都不会被销毁。你必须找到,然后打破依赖关系。

如果可能,请使用 boost 智能指针,并将 shared_ptr 用于应该是数据所有者的指针,将 weak_ptr 用于不应该调用 delete 的指针。

于 2008-09-17T00:09:19.523 回答
7

我这样做的方法很简单: - 在每个 AddRef() 记录调用堆栈上, - 匹配的 Release() 将其删除。这样,在程序结束时,我只剩下 AddRefs() 而没有处理 Releases。无需配对,

于 2008-09-15T21:45:53.120 回答
4

如果您可以确定性地重现泄漏,我经常使用的一种简单技术是按构造顺序对所有智能指针进行编号(在构造函数中使用静态计数器),并将此 ID 与泄漏一起报告。然后再次运行程序,并在构造具有相同 ID 的智能指针时触发 DebugBreak()。

您还应该考虑这个很棒的工具: http: //www.codeproject.com/KB/applications/visualleakdetector.aspx

于 2008-09-16T14:27:52.290 回答
4

我所做的是用一个带有FUNCTIONLINE参数的类来包装智能指针。每次调用构造函数时增加该函数和行的计数,每次调用析构函数时减少计数。然后,编写一个转储函数/行/计数信息的函数。这会告诉您所有引用的创建位置

于 2008-09-16T14:45:50.437 回答
4

要检测引用周期,您需要拥有所有引用计数对象的图表。这样的图并不容易构建,但可以做到。

创建一个全局set<CRefCounted*>对象来注册活的引用计数对象。如果您有通用的 AddRef() 实现,这会更容易 - 只需this在对象的引用计数从 0 变为 1 时添加指向集合的指针。类似地,在 Release() 中,当引用计数从 1 变为 0 时从集合中删除对象。

接下来,提供一些方法来从每个CRefCounted*. 它可能是一个virtual set<CRefCounted*> CRefCounted::get_children()或任何适合你的东西。现在你有一种方法来遍历图表。

最后,在有向图中实现您最喜欢的循环检测算法。启动程序,创建一些循环并运行循环检测器。享受!:)

于 2008-10-09T21:44:00.097 回答
2

我为解决这个问题所做的是覆盖malloc/newfree/delete运算符,以便它们尽可能多地在数据结构中跟踪您正在执行的操作。

例如,在覆盖malloc/new时,您可以创建调用方地址、请求的字节数、返回的分配指针值和序列 ID 的记录,这样您的所有记录都可以排序(我不知道您是否处理线程,但您也需要考虑到这一点)。

在编写释放/删除例程时,我还跟踪调用者的地址和指针信息。然后我向后查看列表并尝试使用指针作为键来匹配malloc/new对应项。如果我没有找到它,请举起红旗。

如果您负担得起,您可以在数据中嵌入序列 ID,以绝对确定谁以及何时进行了分配调用。这里的关键是尽可能地唯一标识每个交易对。

然后你将有第三个例程显示你的内存分配/释放历史,以及调用每个事务的函数。(这可以通过从链接器中解析符号映射来完成)。您将随时知道您将分配多少内存以及是谁分配的。

如果您没有足够的资源来执行这些事务(我的典型案例是 8 位微控制器),您可以通过串行或 TCP 链接将相同的信息输出到具有足够资源的另一台机器。

于 2008-09-15T21:53:14.240 回答
2

既然您说您使用的是 Windows,那么您也许可以利用 Microsoft 的用户模式转储堆实用程序UMDH,该实用程序与Debugging Tools for Windows一起提供。UMDH 制作应用程序内存使用情况的快照,记录每次分配使用的堆栈,并让您比较多个快照以查看对分配器的哪些调用“泄漏”了内存。它还使用 dbghelp.dll 将堆栈跟踪转换为符号。

还有另一个名为“LeakDiag”的 Microsoft 工具,它支持比 UMDH 更多的内存分配器,但它有点难找,而且似乎没有得到积极维护。如果我没记错的话,最新版本至少有五年历史了。

于 2008-09-16T02:21:22.380 回答
2

这不是找到泄漏的问题。在智能指针的情况下,它很可能会指向一些通用的地方,比如 CreateObject(),它被调用了数千次。这是一个确定代码中的哪个位置没有在引用计数的对象上调用 Release() 的问题。

于 2008-09-16T07:24:41.387 回答
1

如果我是你,我会记录日志并编写一个快速脚本来执行以下操作(我的是 Ruby):

def allocation?(line)
  # determine if this line is a log line indicating allocation/deallocation
end

def unique_stack(line)
  # return a string that is equal for pairs of allocation/deallocation
end

allocations = []
file = File.new "the-log.log"
file.each_line { |line|
  # custom function to determine if line is an alloc/dealloc
  if allocation? line
    # custom function to get unique stack trace where the return value
    # is the same for a alloc and dealloc
    allocations[allocations.length] = unique_stack line
  end
}

allocations.sort!

# go through and remove pairs of allocations that equal,
# ideally 1 will be remaining....
index = 0

while index < allocations.size - 1
  if allocations[index] == allocations[index + 1]
    allocations.delete_at index
  else
    index = index + 1
  end
end

allocations.each { |line|
  puts line
}

这基本上通过日志并捕获每个分配/解除分配并为每对存储一个唯一值,然后对其进行排序并删除匹配的对,看看还剩下什么。

更新:抱歉所有中间编辑(我在完成之前不小心发布了)

于 2008-09-15T21:37:04.607 回答
1

对于 Windows,请查看:

MFC 内存泄漏检测

于 2008-09-15T22:26:24.817 回答
1

我是Google 的 Heapchecker 的忠实粉丝——它不会捕获所有泄漏,但它会捕获大部分泄漏。(提示:将其链接到您的所有单元测试中。)

于 2008-09-16T09:21:51.217 回答
0

第一步可能是知道什么类正在泄漏。一旦知道了,就可以知道是谁在增加引用: 1. 在由 shared_ptr 包裹的类的构造函数上下断点。2. 在 shared_ptr 增加引用计数时使用调试器介入:查看变量 pn->pi_->use_count_ 通过评估表达式获取该变量的地址(类似于:&this->pn->pi_.use_count_),您将获得一个地址 3. 在 Visual Studio 调试器中,转到 Debug->New Breakpoint->New Data Breakpoint... 输入变量的地址 4. 运行程序。每当代码中的某个点增加和减少引用计数器时,您的程序都会停止。然后你需要检查它们是否匹配。

于 2013-03-21T11:51:22.417 回答