固定的:
好吧,这似乎有点傻。原来 top 显示不正确,程序实际上继续运行。也许CPU时间变得太大而无法显示?无论哪种方式,该程序似乎都运行良好,而整个问题都没有实际意义。
谢谢(很抱歉这个愚蠢的问题)。
原问:
我正在运行 Ubuntu 服务器 10.04.3 的计算机上运行模拟。短期运行(<24 小时)运行良好,但长期运行最终会停止。停止,我的意思是程序不再获得任何 CPU 时间,但它仍将所有信息保存在内存中。为了运行这些模拟,我对程序进行 SSH 和 nohup 并将任何输出通过管道传输到文件。
其他信息:
系统肯定没有用完 RAM。该程序在完成之前不需要读取或写入硬盘驱动器;计算完全在内存中完成。该程序没有被杀死,因为它在停止后仍然有一个 PID。我正在使用openmp,但是增加了最大进程数并且最大时间是无限的。我正在使用 ARPACK fortran 库找到矩阵的最大特征值。
关于导致这种行为的原因或如何恢复我目前停滞的程序的任何想法?
谢谢