qsub
您可以使用诸如-l h_vmem=6G
保留 6 GB 物理内存的选项来设置资源限制,例如所需的物理内存。
对于文件块,您也可以设置h_fsize
为适当的值。
请参阅 qconf 手册页的资源限制部分:
http://gridscheduler.sourceforge.net/htmlman/htmlman5/queue_conf.html
s_cpu The per-process CPU time limit in seconds.
s_core The per-process maximum core file size in bytes.
s_data The per-process maximum memory limit in bytes.
s_vmem The same as s_data (if both are set the minimum is
used).
h_cpu The per-job CPU time limit in seconds.
h_data The per-job maximum memory limit in bytes.
h_vmem The same as h_data (if both are set the minimum is
used).
h_fsize The total number of disk blocks that this job can
create.
此外,如果集群对每个节点使用本地 TMPDIR,并且已满,您可以将 TMPDIR 设置为具有更多容量的备用位置,例如 NFS 共享:
export TEMPDIR=<some NFS mounted directory>
然后使用将当前环境导出到作业qsub
的选项启动。-V
以上一项或多项组合可能会帮助您解决问题。