问题标签 [pbs]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1963 浏览

pbs - 如何将 qsub 输出重定向到文本文件

在我的代码中,我想使用 qsub 输出信息,例如作业 ID、节点名称等,所以我考虑在分配节点时将 qsub 输出重定向到某个文件中,以便以后使用我的代码。

例如,当我使用请求交互式节点时

我得到这些输出

我可以在分配节点时将这些信息重定向到文本文件中吗?

我尝试了类似的东西

它给了我一个错误

0 投票
2 回答
2335 浏览

pbs - 使用 SGE 查找集群上的空闲节点

我正在寻找相当于 PBS 的“qstat -freenodes”的 SGE,基本上我想找到所有没有运行的节点。建议?

0 投票
1 回答
138 浏览

parallel-processing - .pbs 文件中的幼稚并行化

是否可以在 PBS 文件中的 for 循环中进行并行化?

下面是我的尝试.pbs 文件。我想分配 4 个节点并同时为每个节点分配 16 个进程。我已经成功完成了这项工作,但现在我有 4 个工作,我想向每个节点发送一个工作。(我需要这样做,因为排队算法会让我等待几天在我正在使用的集群上提交 4 个单独的作业)

这些作业独立运行,不使用相同的数据。我可以从同一个 pbs 脚本为每个节点运行 1 个作业吗?

谢谢你。

0 投票
3 回答
421 浏览

parallel-processing - 使用 PBS 脚本并行执行

我正在尝试编写 PBS 脚本。

我必须在一个集群中使用 4 个节点并运行 4 次可执行程序。困难在于 4 个执行必须并行运行,一个节点一个

目前,我刚刚分配了节点

问题是我不知道如何确保程序并行运行。我该怎么做 ?

0 投票
2 回答
2839 浏览

pbs - PBS/Torque - 无法删除已完成的作业状态信息

命令 'qstat -a' 为已完成的作业输出大量信息行,所有这些作业的状态都是 'C'。似乎他们将永远停留。由于这些工作已经“完成”,如何清理这些不需要的工作信息?谢谢!

0 投票
2 回答
8520 浏览

r - 通过 qsub 运行 R 脚本

我正在尝试运行一个名为through的R脚本。我的脚本如下:test.rqsubR

如果在 Ubuntu 终端中输入R CMD BATCH test.r,则脚本按计划运行;test.csv在同一目录中导出。

但是,如果我创建一个名为并通过命令运行它的bash脚本;它会运行没有错误,但输出不会存在。testbash.shqsub testbash.sh

如何解决这个问题?

0 投票
1 回答
1292 浏览

memory - TORQUE SERVER:内存超出时如何避免工作被杀?

我安装了一个 Torque 服务器,我添加了一个节点,它工作正常。

但我不明白作业配置是如何工作的。

这是我的作业配置:“#PBS -l vmem=128mb”,我的作业使用更多内存,因此 Torque 服务器会终止该进程。如果我增加该值,它会很好地工作。

pvmem = 作业中任何单个进程使用的最大虚拟内存量。(在 Unicos 上被忽略。)

有一个服务器配置可以让进程在超出内存时运行,但我没有找到此信息。

0 投票
1 回答
180 浏览

arrays - 如何创建一个作业脚本来自动化这个?

现在我正在集群上执行以下操作:

(i) qsub-X -I -l walltime=60:00:00,nodes=1:ppn=8

(ii) 提交具有以下内容的myjob(使用./myjob)

(iii) 提交后,我打开一个新连接,使用 (i) 进行 qsub,编辑 myjob 文件,即将 i 从 {1,-1} 更改为 {2,-2},然后提交 ./myjob。

我从 i=1,-1 到 i=20,-20 重复这个过程。

没有办法自动化吗?我花了一天(实际上超过一天)尝试使用作业数组、for 循环等来完成这项工作。应该有一种快速的方法来要求 160 个处理器并提交这项工作,或者我们人类还没有进阶到计算机的那个阶段?

任何帮助都非常非常感谢。

PS - 是的,我知道我不是计算机巫师,请原谅我的无知。

0 投票
0 回答
146 浏览

cluster-computing - PBS 非统一进程请求和 qstat 输出

我正在开发一个 18 节点集群,运行 TORQUE/PBS Pro/Open MPI。

设置 - 2 个 CPU/节点,12 个内核/CPU(因此每个节点允许 24 个进程)。

如果我提交需要在节点之间进行不均匀拆分的 PBS 作业,例如需要 58 个进程的作业,我可以通过以下方式拆分它:

它使用所有 24 个内核分配 2 个节点,使用 10 个内核分配 1 个节点。所以我现在应该有 58 个任务正在运行。

但是,当我执行时qstat -a,输出显示我只有 48 个任务正在运行。它似乎从不计算不均匀分裂的节点。

那么,这 10 个额外的进程是否真的在运行?这是怎么回事?只是输出qtsat不正确吗?

我翻遍了所有我能找到的 PBS 自述文件/手册,没有运气。

0 投票
1 回答
1536 浏览

mpi - Torque + mpirun + 资源分配

我在具有 24 个内核的单台机器上使用 Open MPI 运行 Torque。为什么可以在我的作业中指定,例如,nodes=1:ppn:2 并且仍然能够运行 mpirun -np 12 WhatEverCommand 指定的作业?在这种情况下,作业在 12 个核心上执行,即使“节点”表示 2 个 CPU。指定“节点”选项不会对提交的作业使用的资源有任何限制吗?如果没有,那么如何通过覆盖声明的资源来防止用户违反服务器规则?

另一方面 - 指定 nodes=1:ppn=8 和 mpirun 没有“-np”选项,只给我 1 个 cpu 运行作业。

我有那么糟糕并且在这里缺少一些基本的东西吗?