1

我必须在具有 20 个节点的集群中的特定节点上运行代码。集群在 Cent OS 上运行。我正在从 ubuntu 12.04 建立 ssh 连接。我必须运行一个名为 training.py 的 python 脚本。安装了多个版本的python(2.4、2.7、3.2)。作为一个linux新手,我有以下疑问:

对于 qrsh 命令:

  1. 如何选择特定节点来运行我的代码?
  2. 如果系统默认运行 2.4,如何选择 python 版本 2.7。

对于 qsub 命令

  1. 如何使用脚本提交作业。我是脚本新手。请推荐一个教程。但就目前而言,将 training.py 放入队列的简单脚本将非常有帮助。
  2. 在脚本中我不得不提到要运行的 python 版本。
  3. 我想设计一个实验,当不同的值被传递给training.py时,依次多次调用parameters.py和training.py。我怎样才能做到这一点 ?

提前致谢 ?

4

1 回答 1

2

qsub 有多种发行版,每种发行版都有自己的语法(pbs_pro、torque、openpbs)。

如果您使用扭矩变体,请查看文档的第 2 章。 http://docs.adaptivecomputing.com/torque/help.htm

基本上你提交这样的工作

qsub -l nodes=1:ppn=2 -l walltime=300 -l node=foo training.py

您也可以将这些标志添加为作业提交脚本的一部分。

cat training.py
#!/usr/bin/python
#PBS nodes=foo
#PBS walltime=300

要指定使用哪个版本的 python,您需要自己安装 python(假设您有 root),或者请求您的系统管理员在节点上为您安装 python 2.7。

于 2013-10-01T15:47:21.853 回答