11

我们正在开发一个相当大的 Windows 窗体应用程序。在几个客户的计算机中,它经常因 OutOfMemory 异常而崩溃。在异常发生后(从 UnhandledException 处理程序调用 clrdump)获得应用程序的完整内存转储后,我使用“.NET Memory Profiler”和 windbg 对其进行了分析。

Memory Profiler 在活动对象实例中仅显示 130MB。有趣的是,对于许多对象类型来说,已经显示了非常多的无法访问的实例(例如 22000 个无法访问的 Byte[] 实例)。在本机内存统计中,所有数据堆中的数据总计为 127MB(没问题),但表示第 2 代堆中的 133MB 和大堆中的 640MB(不好!)。

使用 windbg 分析转储时,确认了上述统计信息:

!dumpheap -stat
..... acceptable object sizes...
79330a00   467216     30638712 System.String
0016d488     4804    221756612      Free
79333470    27089    574278304 System.Byte[]

应用程序在运行时确实使用了大量的短缓冲区,但不会泄漏它们。使用 !gcroot 测试许多 Byte[] 实例最终没有根。显然,如内存分析器所示,这些数组中的大多数都是不可访问的。

只是为了确保一切正常,!finalizequeue 显示没有对象正在等待完成

generation 0 has 138 finalizable objects (18bd1938->18bd1b60)
generation 1 has 182 finalizable objects (18bd1660->18bd1938)
generation 2 has 75372 finalizable objects (18b87cb0->18bd1660)
Ready for finalization 0 objects (18bd1b60->18bd1b60)

并且还检查本机终结器线程堆栈跟踪是否显示它没有被阻止。

目前我不知道如何诊断 GC 不收集数据的原因(我相信它会很乐意,因为进程内存不足..)

编辑:根据下面的输入,我阅读了更多关于大型对象堆碎片的信息,似乎情况可能如此。

我已经看到一些建议为这种数据分配更大的内存块(在我的情况下是各种字节 [])并自己管理该区域的内存,但这似乎是一个相当老套的解决方案,而不是我所期望的解决不那么特殊的桌面应用程序的问题。

碎片问题是由于 LOH 上的对象在存在期间没有重新定位这一事实(至少这是许多 Microsoft 的博客中所说的)造成的,这是可以理解的,但一旦达到一定的内存压力似乎是合乎逻辑的,例如面临 OOM 的威胁,应执行重定位。

在完全相信碎片是原因之前,唯一让我担心的是,LOH 上的这么多对象没有 gcroot 引用 - 这是因为即使对于 LOH 垃圾收集也只是部分执行?

我会很高兴为我指出任何有趣的解决方案,因为目前我所知道的唯一一个是一些预分配内存块的自定义管理。

欢迎任何想法。谢谢。

4

4 回答 4

4

LOH 会出现碎片化。本文提供了分析和解决它的基本方向。
也许您可以发布一些代码来显示这些 byte[] 缓冲区的“典型”用法?

于 2009-10-10T23:08:58.233 回答
2

和往常一样,事实证明并没有什么不同。我们发现了一个用例,其中应用程序确实消耗了大量内存并最终会出现 OOM。在我们发现之前我们得到的转储中有什么奇怪的是有很多没有 gcroot 的对象 - 我不明白为什么它没有被释放并用于新的分配?然后我想到,当 OOM 发生时可能发生了什么 - 堆栈已展开,拥有内存的对象不再可访问,然后执行了转储。这就是为什么似乎有很多内存可以被 GC 处理的原因。

我在调试版本中所做的 - 检索真实的内存状态转储 - 是创建一个 Threading.Timer 来检查是否可以分配一些相当大的对象 - 如果无法分配,这是一个指示我们在 OOM 附近,现在是进行内存转储的好时机。代码如下:

private static void OomWatchDog(object obj)
{
 try                          
 {
   using(System.Runtime.MemoryFailPoint memFailPoint = 
          new System.Runtime.MemoryFailPoint(20))
   {
   }
 }
 catch (InsufficientMemoryException)
 {
   PerformDump();
 }
}
于 2009-10-12T19:38:49.040 回答
1

如果您认为 LOH 是问题所在,那么在 LOH 分配上设置一个断点可以为您指明正确的方向。你可能会做这样的事情

bp mscorwks!gc_heap::allocate_large_object "!clrstack;.echo *********分配大对象堆***********;g"

于 2009-10-27T15:06:10.320 回答
1

有时 Image.FromFile("a non-image file") 会抛出 OutOfMemoryException。零字节文件就是这样一种文件。

于 2009-10-10T23:18:24.860 回答