我正在尝试将作业提交到集群 [运行 Sun Grid Engine (SGE)]。该工作不断被终止,报告如下:
Job 780603 (temp_new) Aborted
Exit Status = 137
Signal = KILL
User = heaswara
Queue = std.q@comp-0-8.local
Host = comp-0-8.local
Start Time = 08/24/2013 13:49:05
End Time = 08/24/2013 16:26:38
CPU = 02:46:38
Max vmem = 12.055G
failed assumedly after job because:
job 780603.1 died through signal KILL (9)
我设定的资源要求是:
#$ -l mem_free=10G
#$ -l h_vmem=12G
mem_free
是我的作业需要h_vmem
的内存量,是作业允许使用的内存量的上限。我想知道我的工作将被终止,因为它需要超过该阈值(12G)。有没有办法估计我的操作需要多少内存?我试图弄清楚应该是上限。提前致谢。