11

我在 Visual Studio 2010 IDE 的 Windows Server GoDaddy VPS 上以调试模式 (F5) 运行了一个 .NET 2.0 控制台应用程序。

应用程序会定期冻结(好像垃圾收集器已暂时暂停执行),但在极少数情况下它永远不会恢复执行!

几个月来我一直在诊断这个问题,而且我的想法已经不多了。

  • 应用程序尽可能快地运行(它使用 100% 的 CPU 使用率),但以正常优先级运行。它也是多线程的。
  • 当应用程序冻结时,我可以使用 VS2010 IDE 通过暂停/取消暂停进程来解冻它(因为它正在调试器中运行)。
  • 当我暂停冻结进程时,上次执行的位置似乎无关紧要。
  • 冻结时,CPU 使用率仍为 100%。
  • 解冻后,它运行良好,直到下一次冻结。
  • 服务器可能会在两次冻结之间运行 70 天,也可能只运行 24 小时。
  • 内存使用保持相对恒定;没有任何形式的内存泄漏的证据。

任何人都有任何提示来诊断到底发生了什么?

4

3 回答 3

16

它也是多线程的

这是问题的关键部分。您正在描述一种非常典型的多线程程序可能行为不端的方式。它遭受死锁,这是线程的典型问题之一。

它可以从信息进一步缩小,显然你的进程没有完全冻结,因为它仍然消耗 100% cpu。您的代码中可能有一个热等待循环,一个在另一个线程上旋转的循环发出一个事件信号。这可能会导致一种特别讨厌的死锁,即活锁。活锁对时间非常敏感,代码运行顺序的微小变化可能会将其撞到活锁。并再次退出。

活锁非常难以调试,因为尝试这样做会使条件消失。就像附加调试器或破坏代码一样,足以改变线程时序并将其排除在条件之外。或者在代码中添加日志语句,这是调试线程问题的常用策略。由于日志记录开销而改变了时间,这反过来又可以使活锁完全消失。

讨厌的东西,不可能从像 SO 这样的网站获得解决此类问题的帮助,因为它非常依赖于代码。通常需要对代码进行彻底的审查才能找到原因。并且经常进行剧烈的重写。祝你好运。

于 2013-02-01T13:47:03.940 回答
2

应用程序是否有“死锁恢复/预防”代码?也就是说,用超时锁定,然后再试一次,也许是在睡觉后?

应用程序是否检查错误代码(返回值或异常)并在任何地方出现错误时反复重试?

请注意,这种循环也可以通过事件循环发生,您的代码仅在某些事件处理程序中。它不必是您自己的代码中的实际循环。尽管情况可能并非如此,但如果应用程序被冻结,则表明事件循环被阻塞。

如果您有上述情况,您可以尝试通过将超时和睡眠设为随机间隔来缓解问题,以及在错误可能产生死锁/活锁的情况下添加短随机持续时间的睡眠。如果这样的循环对性能敏感,请添加一个计数器并仅开始随机睡眠,可能会在一些失败的重试次数后增加间隔。并确保您添加的任何睡眠都不会在某些东西被锁定时进入睡眠状态。

如果这种情况会更频繁地发生,您还可以使用它来平分您的代码并查明哪些循环(因为 100% 的 CPU 使用意味着,一些非常繁忙的循环正在旋转)负责。但是从问题的罕见性来看,如果问题在实践中消失,我认为你会很高兴;)

于 2013-02-07T13:45:17.617 回答
0

好吧,这里有三件事......

首先,开始使用.NET的服务器GC:http: //msdn.microsoft.com/en-us/library/ms229357.aspx。这可能会使您的应用程序不被阻塞。

其次,如果你可以在你的虚拟机上做到这一点:检查更新。这似乎总是很明显,但我见过很多情况下简单的 Windows 更新可以解决奇怪的问题。

第三,我想说明一个对象的生命周期,这可能是这里的问题之一。这是一个很长的故事,所以请耐心等待。

对象的生命周期基本上是构造-垃圾收集-终结。所有三个进程都在一个单独的线程中运行。GC 将数据传递给具有调用“析构函数”的队列的终结线程。

那么,如果你的终结器做了一些奇怪的事情,你可以说:

public class FinalizerObject
{
    public FinalizerObject(int n)
    {
        Console.WriteLine("Constructed {0}", n);
        this.n = n;
    }

    private int n;

    ~FinalizerObject()
    {
        while (true) { Console.WriteLine("Finalizing {0}...", n); System.Threading.Thread.Sleep(1000); }
    }
}

因为终结器在处理队列的单独线程中运行,所以只有一个终结器做一些愚蠢的事情对您的应用程序来说是一个严重的问题。您可以通过使用上述类 2 次来看到这一点:

    static void Main(string[] args)
    {
        SomeMethod();
        GC.Collect(GC.MaxGeneration);
        GC.WaitForFullGCComplete();
        Console.WriteLine("All done.");
        Console.ReadLine();
    }

    static void SomeMethod()
    {
        var obj2 = new FinalizerObject(1);
        var obj3 = new FinalizerObject(2);
    }

请注意,您最终是如何导致少量内存泄漏的,并且如果您删除 Thread.Sleep 并同时使用 100% CPU 进程 - 即使您的主线程仍在响应。因为它们是不同的线程,所以从这里开始很容易阻塞整个进程——例如通过使用锁:

    static void Main(string[] args)
    {
        SomeMethod();
        GC.Collect(GC.MaxGeneration);
        GC.WaitForFullGCComplete();
        Thread.Sleep(1000);
        lock (lockObject)
        {
            Console.WriteLine("All done.");
        }
        Console.ReadLine();
    }

    static object lockObject = new Program();

    static void SomeMethod()
    {
        var obj2 = new FinalizerObject(1, lockObject);
        var obj3 = new FinalizerObject(2, lockObject);
    }

    [...]

    ~FinalizerObject()
    {
        lock (lockObject) { while (true) { Console.WriteLine("Finalizing {0}...", n); System.Threading.Thread.Sleep(1000); } }
    }

所以我可以看到你在想“你是认真的吗?”;事实是,您可能正在做这样的事情,甚至没有意识到这一点。这就是“产量”出现的地方:

'yield' 中的 IEnumerable 实际上是 IDisposable,因此实现了 IDisposable 模式。将你的“yield”实现与锁结合起来,忘记通过用“MoveNext”等枚举它来调用 IDisposable,你会得到一些反映上述情况的非常讨厌的行为。特别是因为终结器是由一个单独的线程(!)从终结队列中调用的。将它与无限循环或线程不安全代码结合起来,你会得到一些非常讨厌的意外行为,这些行为会在特殊情况下触发(当内存耗尽时,或者当 GC 事情它应该做的事情时)。

换句话说:我会检查你的一次性用品和终结器,并对它们非常挑剔。检查 'yield' 是否有隐式终结器,并确保从同一个线程调用 IDisposable。您要警惕的一些事情的例子:

    try
    {
        for (int i = 0; i < 10; ++i)
        {
            yield return "foo";
        }
    }
    finally
    {
        // Called by IDisposable
    }

    lock (myLock) // 'lock' and 'using' also trigger IDisposable
    {
        yield return "foo";
    }
于 2013-02-08T09:12:21.690 回答