问题标签 [torque]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
81 浏览

cluster-computing - 如何在具有 2 个计算节点和 1 个头节点的扭矩集群中运行数据包捕获程序?

我使用带有 2 个计算节点和 1 个头节点的扭矩 pbs 配置了一个集群。我使用 qsub 命令(如 qsub myscript.sh)提交了作业

myscript.sh 包含一些 shell 代码。该脚本在任何计算节点中都成功执行,结果我得到了一些输出文件。这种类型的作业提交和执行非常容易。但是我在以下方面面临很多问题......

我有一个用 C 语言编写的带有 libpcap 依赖项的网络数据包捕获模块。我的要求是这样的。我想将此程序提交到不同的计算节点(computenode-0-0,computenode-0-1)。因此,无论所有数据包都到达头节点,这些数据包都将由我在计算节点中运行的程序处理。

我将如何提交 C 程序?计算节点如何进行负载均衡?我必须在集群中做哪些额外的配置?

0 投票
2 回答
2668 浏览

perl - 如何通过 perl 脚本在 PBS 扭矩中使用 qsub -v 命令?

我想通过使用“qsub -v”命令将变量传递给 perl 脚本。这是我将运行的 perl 脚本(这只是一个测试,但如果它不起作用,我将无法做任何更困难的事情)

所以,如果我要运行这个脚本(不是通过 qsub),我会输入:

但是,我会在使用 pbs 的集群节点上运行此脚本。我做了几次尝试,如下所示:

但它不起作用。任何人都知道我应该如何使用 qsub 将参数传递给我的 perl 脚本?任何帮助将非常感激

不起作用意味着使用 qsub 不会在输出文件上打印任何内容,而仅使用 perl 它会在输出文件中打印输入文件的内容。看起来它不需要任何输入

0 投票
2 回答
868 浏览

perl - 将参数传递给通过 qsub 执行的 perl 脚本

您好想将一个参数传递给我的 perl 脚本,该脚本应该通过 qsub 执行。所以我跑:

在 Test.pl 中,我尝试以多种方式调用 i 参数:

不幸的是 perl 脚本的输出文件总是空的。

你有什么建议吗?我哪里错了?请帮忙

0 投票
1 回答
57 浏览

batch-processing - 避免声明它们在扭矩上免费的非工作机器

我在没有管理员访问权限的 Torque 服务器上运行作业。然而,一个插槽似乎经常声称它是免费的,但是当调度程序为其分配一个作业时,该作业会一直排队。因此,我的大量工作将被分配给该服务器并无限期地排队。

有什么方法可以开始这些工作/将它们移动到另一台机器上?或者在提交作业时可能会避开机器?谢谢!

0 投票
1 回答
248 浏览

python - 复制文件描述符时何时调用flush()?

当我调用 python python-wrapped C++ 时,我有一个包装器来重定向输出。

基本思想是使用dupand dup2,这是我能够printf从 C++ 捕获输出的唯一方法。flush()只要我以交互方式运行作业,包装器就可以正常工作,无需调用,但是当我将作业发送到 TORQUE 批处理时,我再次得到不受欢迎的输出。

我的理解,部分来自这个问题,是一些适当的flush()电话应该解决这个问题,但他们到底需要去哪里?我应该在复制到临时文件之前刷新缓冲区吗?在复制回来之前?两个都?


我使用的包装如下:

0 投票
1 回答
3676 浏览

torque - Torque 无法确定本地服务器主机名

当我尝试在开放堆栈中创建的 vm 上运行“torque.setup”时,我收到错误“无法确定本地服务器主机名”

在任何其他虚拟机管理程序中创建的 VM 上安装扭矩不会出错,并且可以正常工作。

主机名已设置,那么扭矩在抱怨什么?

更新:看起来我没有完全限定的主机名。

到目前为止,向 /etc/hosts 添加主机名并没有解决问题。

0 投票
0 回答
762 浏览

queue - 作业提交后立即进入退出状态

我正在使用 PBS 队列,有一个队列,当我提交作业时,它立即进入退出状态,并且没有可用的输出/错误文件(例如,没有 do.sh.exxxxxxxxx 和 do.sh.oxxxxxxx)

当我使用python提交一系列作业时,一些作业会进入R状态几秒钟,然后进入退出状态。那些已经进入 R 状态的将有输出/错误文件

错误文件显示

tput: No value for $TERM and no -T specified /var/spool/torque/mom_priv/jobs/9282194.redwood.speech.cs.cmu.edu.SC: Command not found.

队列本身应该没问题,因为其他人正在愉快地提交作业,但我什至无法提交作业。我使用的脚本也可以在其他机器上使用,所以我相信脚本应该没问题。我只是不知道为什么有一个我不能提交的特定机器。

感谢您阅读这篇文章,非常感谢您的帮助。

0 投票
1 回答
413 浏览

jobs - Torque PBS Manager 权限规则无法更改

当我尝试这样更改队列时:

设置队列标准 total_jobs=16

我收到以下错误:

qmgr obj=standard svr=default: 无法设置属性、只读或权限不足 total_jobs

我以 root 身份发出命令。

0 投票
0 回答
743 浏览

queue - 为什么 qdel comman 返回“未知作业 ID”

操作系统版本

CentOS release 4.6 (Final) Kernel \r on an \m 2.6.9-100.ELsmp

问题

当我运行 qdel 时,出现以下错误:

qdel:未知作业 ID 20432.scyld.localdomain

信息

qstat -n 的输出

'/var/spool/torque/server_name' 的内容

scyld.localdomain

问题

为什么我会收到错误消息?

0 投票
1 回答
850 浏览

r - 如何使用 Torque/MOAB 调度程序设置 doSNOW 和 SOCK 集群?

继续这个问题(https://stackoverflow.com/questions/17222942/allow-foreach-workers-to-register-and-distribute-sub-tasks-to-other-workers),什么是连接的最佳实践doSNOW 和 SOCK 集群到 Torque/MOAB 调度程序,以避免处理外部并行循环的某些部分代码的内部并行循环中的处理器亲和性?

史蒂夫对那个问题的回答来看,没有调度程序影响的基线代码可能是: