3

我在 C# 2.0 中使用线程池的多线程应用程序每隔几周就会在 prod 中挂起。

我做了一个同步块

!syncblk

Index SyncBlock MonitorHeld Recursion Owning Thread Info SyncBlock Owner
  201 05b9493c 979 1 05bc1040 bcc 45 022f3490 System.Collections.ArrayList
 2875 05b4c914 1 1 17b99e10 1af8 290 024862d8 MyProg.MyChildClass
 3045 05b4dbec 1 1 17ca7e98 1990 664 02392120 MyProg.MyChildClass
 3046 05b4dc1c 1 1 17ca8668 1038 666 02394b00 MyProg.MyChildClass
 3194 05b4f80c 3 1 05b5b638 1594 31 02537b88 MyProg.MyChildClass
 3072 05b4e114 1 1 17d660f0 1120 848 023dd578 MyProg.MyChildClass
 3073 05b4e144 1 1 17c45c30 1884 518 023dfc2c MyProg.MyChildClass
 3390 05b51cfc 3 1 16cefcc0 1350 102 02768868 MyProg.MyChildClass
 3072 05b4e114 1 1 17d660f0 1120 848 023dd578 MyProg.MyChildClass
 3073 05b4e144 1 1 17c45c30 1884 518 023dfc2c MyProg.MyChildClass

我删除了数百行如下所示:

3073 05b4e144 1 1 17c45c30 1884 518 023dfc2c MyProg.MyChildClass 

持有 979 个监视器的线程正在锁定一个数组列表,但所有其他正在等待的线程都在尝试获取不同对象上的 readerlock。

我确实知道所有读取器线程都试图获取哪个锁,但我不知道谁持有该锁。我怎么发现?

MonitorHeld = 1 的所有线程都具有类似的 clrstack 和 dso 输出。这是持有 979 个锁 (id = 45) 和等待读取器线程 (id = 290) 的线程的 dso 和 clrstack 输出。同样,当我执行 ~* e !clrstack 时,Monitor.Enter 的所有线程都具有与以下 2 个线程上的 clrstack 相同的堆栈

0:000> ~45e !clrstack
操作系统线程 ID:0xbcc (45)
ESP EIP     
17fbe590 77d2013d [GCFrame: 17fbe590]
17fbe6cc 77d2013d [HelperMethodFrame: 17fbe6cc] System.Threading.Monitor.Enter(System.Object)
17fbe720 00638427 MyProg.MyParentClass.ClockTimeElapsed(System.DateTime)
17fbe798 00637cf6 MyProg.MyEngine.ClockTimeElapsed(System.Object)
17fbe830 71df843f System.Threading._TimerCallback.TimerCallback_Context(System.Object)
17fbe838 71e302ff System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext,System.Threading.ContextCallback,System.Object)
17fbe850 71df83ab System.Threading._TimerCallback.PerformTimerCallback(System.Object)
17fbe9dc 74071b4c [GCFrame: 17fbe9dc]
0:000> ~45e!dso
操作系统线程 ID:0xbcc (45)
ESP/REG 对象名称
17fbe5a8 022a2ff4 System.Globalization.DaylightTime
17fbe5ac 022a2f3c System.Int32
17fbe5c8 02537b88 MyProg.MyChildClass
17fbe738 02537b88 MyProg.MyChildClass
17fbe740 02537b88 MyProg.MyChildClass
17fbe7ac 11572f28 System.Collections.ArrayList+ArrayListEnumeratorSimple
17fbe7b0 022f3490 System.Collections.ArrayList
17fbe7b4 0231860c System.String 加载 MyConfig.txt 时出错
17fbe7c0 022f3014 MyProg.MyEngine
17fbe84c 0231b48c System.Threading._TimerCallback
17fbe9fc 0231b48c System.Threading._TimerCallback
0:000> ~290e !clrstack
操作系统线程 ID:0x1af8 (290)
ESP EIP     
2e77f39c 77d2013d [HelperMethodFrame_1OBJ: 2e77f39c] System.Threading.ReaderWriterLock.AcquireReaderLockInternal(Int32)
2e77f3f8 0c3630d4 MyProg.MyEngine.GetBuyValue()
2e77f424 076fd4ad MyProg.MyParentClass.Execute(System.Object)
2e77f474 71e19fcf System.Threading._ThreadPoolWaitCallback.WaitCallback_Context(System.Object)
2e77f47c 71e302ff System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext,System.Threading.ContextCallback,System.Object)
2e77f494 71e1a533 System.Threading._ThreadPoolWaitCallback.PerformWaitCallbackInternal(System.Threading._ThreadPoolWaitCallback)
2e77f4a8 71e1a3c9 System.Threading._ThreadPoolWaitCallback.PerformWaitCallback(System.Object)
2e77f638 74071b4c [GCFrame: 2e77f638]
0:000> ~290e!dso
操作系统线程 ID:0x1af8 (290)
ESP/REG 对象名称
2e77f35c 022f3014 MyProg.MyEngine
2e77f360 02369b98 System.Threading.ContextCallback
2e77f378 02369b98 System.Threading.ContextCallback
2e77f3dc 023188f8 System.Threading.ReaderWriterLock
2e77f400 024862d8 MyProg.MyChildClass
2e77f410 02369b98 System.Threading.ContextCallback
2e77f430 024862d8 MyProg.MyChildClass
2e77f43c 024862d8 MyProg.MyChildClass
2e77f460 02369b98 System.Threading.ContextCallback
2e77f490 1156dd74 System.Threading._ThreadPoolWaitCallback
4

1 回答 1

3

我认为你应该试试这个人写的扩展 dll SOSEX http://stevestechspot.com/,有一个!dlk命令试图找到死锁,他最近添加了一些你会感兴趣的新命令:

!mlocks – 列出所有托管锁和非托管 CriticalSection,以及它们的所有者线程 ID。!mwaits - 列出所有等待的线程,如果可以确定,列出它们正在等待的锁对象。

于 2012-06-07T21:19:24.083 回答