3

我有一个正在尝试调试的旧 Windows.Forms 应用程序。

有时运行几分钟后会产生 ArithmeticException 或 OverflowException。源代码必须在代码库中的某个位置,但堆栈跟踪始终指向该行Application.Run(mainForm);

StackTrace 没有用,因为它只显示 Windows.Forms 本机调用:

 bei System.Windows.Forms.UnsafeNativeMethods.DispatchMessageW(MSG& msg)
   bei System.Windows.Forms.Application.ComponentManager.System.Windows.Forms.UnsafeNativeMethods.IMsoComponentManager.FPushMessageLoop(Int32 dwComponentID, Int32 reason, Int32 pvLoopData)
   bei System.Windows.Forms.Application.ThreadContext.RunMessageLoopInner(Int32 reason, ApplicationContext context)
   bei System.Windows.Forms.Application.ThreadContext.RunMessageLoop(Int32 reason, ApplicationContext context)
   bei System.Windows.Forms.Application.Run(Form mainForm)
   bei Program.Main() in C:\xy\Program.cs:Zeile 102.

System.Windows.Forms.Application.ThreadException为了找到异常的来源,我在和 to中添加了一个异常处理程序 System.AppDomain.CurrentDomain.UnhandledException

我已经尝试启用和禁用捕获异常 System.Windows.Forms.Application.SetUnhandledExceptionMode();

ThreadException 事件处理程序永远不会被调用。UnhandledException 事件处理程序只报告我在 Visual Studio 中看到的相同异常。

在 Visual Studio 中,我在抛出异常时启用了中断执行: 在此处输入图像描述 这没有任何效果。

我该怎么做才能找到有问题的代码行?


编辑:完整的异常细节:

在此处输入图像描述


如果我在没有附加任何调试器的情况下启动进程,并在附加调试器之前等待它崩溃,我会收到以下异常:

Unbehandelte Ausnahme bei 0x0c9f9e1b in program.exe: 0xC0000090: Floating-point invalid operation.

调试然后导致这个反汇编

0C9F9E12  add         esi,10h 
0C9F9E15  push        0CA1FD48h 
0C9F9E1A  push        eax  
0C9F9E1B  fmul        qword ptr ds:[0CA202E0h] 
0C9F9E21  fstp        dword ptr [esp+18h] 

我无法解析这个,但我怀疑这仅仅是 DispatchMessageW 函数

4

1 回答 1

8

这里的诊断是你的进程中有遗留的非托管代码,从你发布的调用堆栈判断,这可能是一个旧的 ActiveX 控件。

这些异常是由浮点处理器 FPU 生成的硬件异常。可以将其置于通过引发异常来报告问题的操作模式,例如您看到的 STATUS_FLOAT_OVERFLOW 和 STATUS_FLOAT_INVALID_OPERATION 异常。而不是生成无穷大、NaN 或非规范化。FMUL 指令很容易产生这样的异常。

更改 FPU 操作模式的软件从根本上与托管代码不兼容。这要求始终屏蔽 FPU 异常。屏蔽这些异常是完全正常的,所有现代软件都会这样做。然而,在上个世纪,这些异常被认为是诊断浮点计算失控的资产。特别是,旧的 Borland 运行时库揭露了这些异常。

好吧,如果您还没有收到该消息,这将是一个相当糟糕的消息。首先要看的是尝试诊断此代码引发浮点异常的原因。不良数据往往是最常见的原因。其次,您确实必须对更改的 FPU 控制寄存器做一些事情,这也很容易导致托管代码失败。特别是 WPF 代码中的一个问题,它喜欢使用 NaN。

使用调试器很容易找到这样的代码。使用 Debug + Windows + Registers 调试器窗口。右键单击窗口并勾选“浮点”选项。CTRL 寄存器的值至关重要,它应该027F在托管程序中。单步执行程序,起初粗略,当寄存器更改时,您发现了麻烦制造者。如果是 64 位程序,还要勾选“SSE”,MXCSR 寄存器应该是00001F80.

您不能使用托管代码直接重置 FPU 控制寄存器,但您可以使用一个技巧。CLR 在处理异常时重置它。因此,一种可能的解决方法是在导致控制寄存器值更改的语句之后故意抛出并捕获异常:

        try {  throw new Exception("Resetting FPU control register, please ignore"); }
        catch { }

在 msvcrt.dll 中调用 _controlfp() 函数是一种更直接的方法。但是,当然,由于两者的副作用,现在该库正在以一种不是为它设计的模式运行,它当然不会期望遇到 Nan 和 Infinity 值。从长远来看,您确实需要考虑淘汰旧组件或库。

于 2013-01-22T19:00:34.587 回答