我对高性能计算机非常陌生。在我的笔记本电脑中,我可以通过键入类似“./prog”的命令来运行程序。但是在 HPC 中,我需要在运行任何作业之前编写一个作业文件。我得到了一个简单的工作文件来开始。但这真的让我很困惑:
#!bin/bash
# BSUB -q
#BSUB -o outfile -R “mem>10”
myjob arg1 arg2
#BSUB -J myjob
有人有处理这种类型的 HPC 的经验吗?非常感谢。
我对高性能计算机非常陌生。在我的笔记本电脑中,我可以通过键入类似“./prog”的命令来运行程序。但是在 HPC 中,我需要在运行任何作业之前编写一个作业文件。我得到了一个简单的工作文件来开始。但这真的让我很困惑:
#!bin/bash
# BSUB -q
#BSUB -o outfile -R “mem>10”
myjob arg1 arg2
#BSUB -J myjob
有人有处理这种类型的 HPC 的经验吗?非常感谢。
如果我没记错的话,您的 HPC 系统称为 LAVA 队列系统,由 HP 开发。
我希望以下内容可以回答您的问题:
bhosts -w
在一行中显示每个节点的状态
bhosts -l
显示每个节点状态的详细信息
bqueues [-l -w -r]
按用户组显示每个节点的状态
bparams [-l -h -V]
显示 bjobs 的可用参数
lsid
显示当前熔岩版本号
lsinfo
显示负载分担信息
lshotst
显示主机及其静态资源信息
lsload
显示主机的负载信息
bjobs -u all
显示工作信息
bjobs <job-id>
按 ID 显示作业信息
bjobs -a
显示所有工作
bjobs -r/-p/-s
显示正在运行/暂停/暂停的作业
bjobs -l
显示更多细节
bhist
显示工作经历
提交工作
bsub my_job
bsub < myscript
bsub -n 4 myjob
bkill 1234
bstop 1234
bresume 1234
更多参考可以在以下位置找到:
http://ccls.lab.sfsu.edu/bin/view/Cluster/LavaSchedulerInformation