c++ - 查找由智能指针引起的内存泄漏

Question

有人知道发现智能指针引起的内存泄漏的“技术”吗？我目前正在开发一个用C++编写的大型项目，该项目大量使用带有引用计数的智能指针。显然，我们有一些由智能指针引起的内存泄漏，它们仍然在代码中的某处被引用，因此它们的内存不会被释放。很难找到带有“不必要”引用的代码行，这会导致相应的对象不被释放（尽管它不再使用）。

我在网上找到了一些建议，建议收集引用计数器的递增/递减操作的调用堆栈。这给了我一个很好的提示，哪段代码导致引用计数器增加或减少。

但我需要的是某种算法，将相应的“增加/减少调用堆栈”组合在一起。删除这对调用堆栈后，我希望（至少）剩下一个“增加调用堆栈”，它向我展示了带有“不必要”引用的代码段，导致相应的对象未被释放。现在修复泄漏没什么大不了的！

但是有人对进行分组的“算法”有想法吗？

开发在Windows XP下进行。

（我希望有人理解，我试图解释的......）

编辑：我说的是循环引用引起的泄漏。

score 18 · Accepted Answer

请注意，引用计数智能指针的泄漏源之一是具有循环依赖关系的指针。例如，A 有一个指向 B 的智能指针，B 有一个指向 A 的智能指针。A 和 B 都不会被销毁。你必须找到，然后打破依赖关系。

如果可能，请使用 boost 智能指针，并将 shared_ptr 用于应该是数据所有者的指针，将 weak_ptr 用于不应该调用 delete 的指针。

score 7 · Accepted Answer

我这样做的方法很简单： - 在每个 AddRef() 记录调用堆栈上， - 匹配的 Release() 将其删除。这样，在程序结束时，我只剩下 AddRefs() 而没有处理 Releases。无需配对，

score 4 · Accepted Answer

如果您可以确定性地重现泄漏，我经常使用的一种简单技术是按构造顺序对所有智能指针进行编号（在构造函数中使用静态计数器），并将此 ID 与泄漏一起报告。然后再次运行程序，并在构造具有相同 ID 的智能指针时触发 DebugBreak()。

您还应该考虑这个很棒的工具： http: //www.codeproject.com/KB/applications/visualleakdetector.aspx

score 4 · Accepted Answer

我所做的是用一个带有FUNCTION和LINE参数的类来包装智能指针。每次调用构造函数时增加该函数和行的计数，每次调用析构函数时减少计数。然后，编写一个转储函数/行/计数信息的函数。这会告诉您所有引用的创建位置

score 4 · Accepted Answer

要检测引用周期，您需要拥有所有引用计数对象的图表。这样的图并不容易构建，但可以做到。

创建一个全局set<CRefCounted*>对象来注册活的引用计数对象。如果您有通用的 AddRef() 实现，这会更容易 - 只需this在对象的引用计数从 0 变为 1 时添加指向集合的指针。类似地，在 Release() 中，当引用计数从 1 变为 0 时从集合中删除对象。

接下来，提供一些方法来从每个CRefCounted*. 它可能是一个virtual set<CRefCounted*> CRefCounted::get_children()或任何适合你的东西。现在你有一种方法来遍历图表。

最后，在有向图中实现您最喜欢的循环检测算法。启动程序，创建一些循环并运行循环检测器。享受！:)

score 2 · Accepted Answer

我为解决这个问题所做的是覆盖malloc/new和free/delete运算符，以便它们尽可能多地在数据结构中跟踪您正在执行的操作。

例如，在覆盖malloc/new时，您可以创建调用方地址、请求的字节数、返回的分配指针值和序列 ID 的记录，这样您的所有记录都可以排序（我不知道您是否处理线程，但您也需要考虑到这一点）。

在编写释放/删除例程时，我还跟踪调用者的地址和指针信息。然后我向后查看列表并尝试使用指针作为键来匹配malloc/new对应项。如果我没有找到它，请举起红旗。

如果您负担得起，您可以在数据中嵌入序列 ID，以绝对确定谁以及何时进行了分配调用。这里的关键是尽可能地唯一标识每个交易对。

然后你将有第三个例程显示你的内存分配/释放历史，以及调用每个事务的函数。（这可以通过从链接器中解析符号映射来完成）。您将随时知道您将分配多少内存以及是谁分配的。

如果您没有足够的资源来执行这些事务（我的典型案例是 8 位微控制器），您可以通过串行或 TCP 链接将相同的信息输出到具有足够资源的另一台机器。

score 2 · Accepted Answer

既然您说您使用的是 Windows，那么您也许可以利用 Microsoft 的用户模式转储堆实用程序UMDH，该实用程序与Debugging Tools for Windows一起提供。UMDH 制作应用程序内存使用情况的快照，记录每次分配使用的堆栈，并让您比较多个快照以查看对分配器的哪些调用“泄漏”了内存。它还使用 dbghelp.dll 将堆栈跟踪转换为符号。

还有另一个名为“LeakDiag”的 Microsoft 工具，它支持比 UMDH 更多的内存分配器，但它有点难找，而且似乎没有得到积极维护。如果我没记错的话，最新版本至少有五年历史了。

score 2 · Accepted Answer

这不是找到泄漏的问题。在智能指针的情况下，它很可能会指向一些通用的地方，比如 CreateObject()，它被调用了数千次。这是一个确定代码中的哪个位置没有在引用计数的对象上调用 Release() 的问题。

score 1 · Accepted Answer

如果我是你，我会记录日志并编写一个快速脚本来执行以下操作（我的是 Ruby）：

def allocation?(line)
  # determine if this line is a log line indicating allocation/deallocation
end

def unique_stack(line)
  # return a string that is equal for pairs of allocation/deallocation
end

allocations = []
file = File.new "the-log.log"
file.each_line { |line|
  # custom function to determine if line is an alloc/dealloc
  if allocation? line
    # custom function to get unique stack trace where the return value
    # is the same for a alloc and dealloc
    allocations[allocations.length] = unique_stack line
  end
}

allocations.sort!

# go through and remove pairs of allocations that equal,
# ideally 1 will be remaining....
index = 0

while index < allocations.size - 1
  if allocations[index] == allocations[index + 1]
    allocations.delete_at index
  else
    index = index + 1
  end
end

allocations.each { |line|
  puts line
}

这基本上通过日志并捕获每个分配/解除分配并为每对存储一个唯一值，然后对其进行排序并删除匹配的对，看看还剩下什么。

更新：抱歉所有中间编辑（我在完成之前不小心发布了）

score 1 · Accepted Answer

1

对于 Windows，请查看：

MFC 内存泄漏检测

于 2008-09-15T22:26:24.817 回答

score 1 · Accepted Answer

我是Google 的 Heapchecker 的忠实粉丝——它不会捕获所有泄漏，但它会捕获大部分泄漏。（提示：将其链接到您的所有单元测试中。）

score 0 · Accepted Answer

第一步可能是知道什么类正在泄漏。一旦知道了，就可以知道是谁在增加引用： 1. 在由 shared_ptr 包裹的类的构造函数上下断点。2. 在 shared_ptr 增加引用计数时使用调试器介入：查看变量 pn->pi_->use_count_ 通过评估表达式获取该变量的地址（类似于：&this->pn->pi_.use_count_），您将获得一个地址 3. 在 Visual Studio 调试器中，转到 Debug->New Breakpoint->New Data Breakpoint... 输入变量的地址 4. 运行程序。每当代码中的某个点增加和减少引用计数器时，您的程序都会停止。然后你需要检查它们是否匹配。

c++ - 查找由智能指针引起的内存泄漏

12 回答 12

Related

Reference