问题标签 [pbs]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pbs - 如何将 qsub 输出重定向到文本文件
在我的代码中,我想使用 qsub 输出信息,例如作业 ID、节点名称等,所以我考虑在分配节点时将 qsub 输出重定向到某个文件中,以便以后使用我的代码。
例如,当我使用请求交互式节点时
我得到这些输出
我可以在分配节点时将这些信息重定向到文本文件中吗?
我尝试了类似的东西
它给了我一个错误
pbs - 使用 SGE 查找集群上的空闲节点
我正在寻找相当于 PBS 的“qstat -freenodes”的 SGE,基本上我想找到所有没有运行的节点。建议?
parallel-processing - .pbs 文件中的幼稚并行化
是否可以在 PBS 文件中的 for 循环中进行并行化?
下面是我的尝试.pbs 文件。我想分配 4 个节点并同时为每个节点分配 16 个进程。我已经成功完成了这项工作,但现在我有 4 个工作,我想向每个节点发送一个工作。(我需要这样做,因为排队算法会让我等待几天在我正在使用的集群上提交 4 个单独的作业)
这些作业独立运行,不使用相同的数据。我可以从同一个 pbs 脚本为每个节点运行 1 个作业吗?
谢谢你。
parallel-processing - 使用 PBS 脚本并行执行
我正在尝试编写 PBS 脚本。
我必须在一个集群中使用 4 个节点并运行 4 次可执行程序。困难在于 4 个执行必须并行运行,一个节点一个
目前,我刚刚分配了节点
问题是我不知道如何确保程序并行运行。我该怎么做 ?
pbs - PBS/Torque - 无法删除已完成的作业状态信息
命令 'qstat -a' 为已完成的作业输出大量信息行,所有这些作业的状态都是 'C'。似乎他们将永远停留。由于这些工作已经“完成”,如何清理这些不需要的工作信息?谢谢!
r - 通过 qsub 运行 R 脚本
我正在尝试运行一个名为through的R
脚本。我的脚本如下:test.r
qsub
R
如果在 Ubuntu 终端中输入R CMD BATCH test.r
,则脚本按计划运行;test.csv
在同一目录中导出。
但是,如果我创建一个名为并通过命令运行它的bash
脚本;它会运行没有错误,但输出不会存在。testbash.sh
qsub testbash.sh
如何解决这个问题?
memory - TORQUE SERVER:内存超出时如何避免工作被杀?
我安装了一个 Torque 服务器,我添加了一个节点,它工作正常。
但我不明白作业配置是如何工作的。
这是我的作业配置:“#PBS -l vmem=128mb”,我的作业使用更多内存,因此 Torque 服务器会终止该进程。如果我增加该值,它会很好地工作。
pvmem = 作业中任何单个进程使用的最大虚拟内存量。(在 Unicos 上被忽略。)
有一个服务器配置可以让进程在超出内存时运行,但我没有找到此信息。
arrays - 如何创建一个作业脚本来自动化这个?
现在我正在集群上执行以下操作:
(i) qsub-X -I -l walltime=60:00:00,nodes=1:ppn=8
(ii) 提交具有以下内容的myjob(使用./myjob)
(iii) 提交后,我打开一个新连接,使用 (i) 进行 qsub,编辑 myjob 文件,即将 i 从 {1,-1} 更改为 {2,-2},然后提交 ./myjob。
我从 i=1,-1 到 i=20,-20 重复这个过程。
没有办法自动化吗?我花了一天(实际上超过一天)尝试使用作业数组、for 循环等来完成这项工作。应该有一种快速的方法来要求 160 个处理器并提交这项工作,或者我们人类还没有进阶到计算机的那个阶段?
任何帮助都非常非常感谢。
PS - 是的,我知道我不是计算机巫师,请原谅我的无知。
cluster-computing - PBS 非统一进程请求和 qstat 输出
我正在开发一个 18 节点集群,运行 TORQUE/PBS Pro/Open MPI。
设置 - 2 个 CPU/节点,12 个内核/CPU(因此每个节点允许 24 个进程)。
如果我提交需要在节点之间进行不均匀拆分的 PBS 作业,例如需要 58 个进程的作业,我可以通过以下方式拆分它:
它使用所有 24 个内核分配 2 个节点,使用 10 个内核分配 1 个节点。所以我现在应该有 58 个任务正在运行。
但是,当我执行时qstat -a
,输出显示我只有 48 个任务正在运行。它似乎从不计算不均匀分裂的节点。
那么,这 10 个额外的进程是否真的在运行?这是怎么回事?只是输出qtsat
不正确吗?
我翻遍了所有我能找到的 PBS 自述文件/手册,没有运气。
mpi - Torque + mpirun + 资源分配
我在具有 24 个内核的单台机器上使用 Open MPI 运行 Torque。为什么可以在我的作业中指定,例如,nodes=1:ppn:2 并且仍然能够运行 mpirun -np 12 WhatEverCommand 指定的作业?在这种情况下,作业在 12 个核心上执行,即使“节点”表示 2 个 CPU。指定“节点”选项不会对提交的作业使用的资源有任何限制吗?如果没有,那么如何通过覆盖声明的资源来防止用户违反服务器规则?
另一方面 - 指定 nodes=1:ppn=8 和 mpirun 没有“-np”选项,只给我 1 个 cpu 运行作业。
我有那么糟糕并且在这里缺少一些基本的东西吗?