问题标签 [qsub]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

370 问题

0 投票

3 回答

1515 浏览

linux - 将键盘命令编码到 Bash 脚本

我有以下方式使用 qsub 提交集群作业：

有没有一种方法可以在 bash 脚本中对 RETURN 和 CTRL-D 进行编码，以便我们可以执行以下操作：

foolishbrat

2009-03-12T11:22:32.603

0 投票

2 回答

3249 浏览

linux - 当我从 Perl 调用它时，为什么我的 awk 单行代码不起作用？

使用AWK的以下命令作为独立命令我没有任何问题，没有任何错误：

但是当我在 Perl 的qsub脚本中应用它们（即在 linux 集群中运行作业）命令时，如下所示：

它给出了以下错误

正确的方法是什么？

linux perl unix awk qsub

foolishbrat

2009-04-02T01:32:12.960

0 投票

2 回答

3307 浏览

pbs - how to limit number of concurrently running PBS jobs

I have a 64-node cluster, running PBS Pro. If I submit many hundreds of jobs, I can get 64 running at once. This is great, except when all 64 jobs happen to be nearly I/O bound, and are reading/writing to the same disk. In such cases, I'd like to be able to still submit all the jobs, but have a max of (say) 10 jobs running at a given time. Is there an incantation to qsub that will allow me to do such, without having administrative access to the cluster's PBS server?

pbs qsub

2010-01-12T23:35:14.057

0 投票

2 回答

424 浏览

scripting - PBS 编程

关于 PBS 的一些简短且可能很愚蠢的问题：

1-我使用

是否可以在作业文件中提交（子）作业？

2-我有以下脚本：

对于启动 job_b，最好在 job_a 的结果完成之前拥有。是否可以设置某种障碍或其他解决方法，以便在 job_a 完成之前不会启动 job_b？

谢谢

scripting job-scheduling pbs qsub torque

2010-03-02T20:32:20.923

0 投票

2 回答

2712 浏览

shell - 从 qsub 集群脚本运行时，脚本无法找到目录/文件

我正在从 qsub shell 脚本在 python 脚本上调用几个 unix 命令和 python，旨在在集群上运行。麻烦的是，当脚本执行时，shell 中似乎出现了问题，因此找不到存在的目录和文件。例如，在 qsub 的 .out 输出文件中，我看到以下错误：

所以脚本不能 cd 进入一个绝对存在的目录。同样，在绝对存在的 python 脚本上调用 python 会产生错误。

知道这里可能出了什么问题，或者我如何尝试调试它？

非常感谢。

shell unix cluster-computing qsub

user248237

2010-03-07T17:09:47.707

0 投票

1 回答

101 浏览

bash - 有人有在 ClusterVisionOS 上运行集群的经验吗？

我目前正在使用 ClusterVisionOS 3.1 处理集群。这将是我第一次使用集群，所以我可能还没有尝试过“显而易见的”。

我可以使用“qsub”命令向集群提交单个作业（我可以正常工作）

但是当一次提交多个作业时，问题就开始了。我可以编写一个脚本一次将它们全部发送，但是所有节点都会被我的工作占用，并且这里有更多的人想要提交他们的工作。

所以这是交易：

32 个节点（每个节点 4 个处理器/插槽）

最好的办法是告诉集群使用 3 个节点（12 个处理器）并在这些节点/处理器上排队我的所有作业，如果这甚至可能的话。如果我可以让节点为每个作业使用 1 个处理器，那将是完美的。

bash cluster-computing qsub multiprocessor

2010-03-11T09:27:42.100

0 投票

2 回答

5110 浏览

exit-code - 从使用 qsub 在 Sun Grid Engine 上提交的进程中获取退出代码

我想通过 Sun Grid Engine（现在：Oracle Grid Engine？）上的 qsub 提交作业。我不希望使用 -sync yes 选项或 qrsh，因为我希望我的控制程序是单线程的并且能够一次启动许多作业。这些选项会阻塞我的控制程序的线程。

但是，我想收到我启动的进程的退出状态。从手册页来看，似乎没有办法在不阻塞我的线程的情况下获取此代码。除了修改我正在启动的作业以将其退出代码打印到标准输出之外，有没有办法获得这种状态？

exit-code qsub single-threaded sungridengine

2010-06-22T07:37:49.943

0 投票

4 回答

5536 浏览

python - 在集群上使用 python 和 PBS 进行“令人尴尬的并行”编程

我有一个生成数字的函数（神经网络模型）。我希望在带有 Torque 的标准集群上使用 PBS 从 python 测试几个参数、方法和不同的输入（意味着函数的数百次运行）。

注意：我尝试了 parallelpython、ipython 等，但从未完全满意，因为我想要更简单的东西。集群处于我无法更改的给定配置中，这种集成 python + qsub 的解决方案肯定会对社区有益。

为了简化事情，我有一个简单的功能，例如：

其中input是表示输入的对象，input.name是字符串，并且do_lots_number_crunching可能持续数小时。

我的问题是：是否有正确的方法来转换诸如参数扫描之类的东西

进入“某事”会为每次调用该model函数启动一个 PBS 脚本？

我正在考虑一个包含 PBS 模板并从 python 脚本中调用它的函数，但还无法弄清楚（装饰器？）。

python pbs qsub embarrassingly-parallel

2010-07-22T10:43:27.120

0 投票

4 回答

33779 浏览

linux - 以 qsub 开头的 shell 脚本的参数

如何参数化在网格上执行的 shell 脚本（以 qsub 开头）？我有一个 shell 脚本，我使用 getopts 来读取参数。

当我使用 qsub 启动 (qsub script.sh -r firstparam -s secondparam ..) 这个工作脚本时，我收到错误消息，

qsub: 无效选项 -- s

qsub: 非法 -r 值

因为 qsub 认为参数是为自己的。然而我还没有找到任何解决方案。

谢谢

linux shell grid-computing qsub

2010-08-17T15:22:54.220

0 投票

1 回答

3742 浏览

python - 在 GridEngine 集群的多个节点上运行作业

我可以访问一个 128 核集群，我想在该集群上运行并行作业。该集群使用 Sun GridEngine，我的程序是使用 Parallel Python、numpy、scipy 在 Python 2.5.8 上编写的。在单个节点（4 核）上运行作业会比单核产生约 3.5 倍的改进。我现在想把它提升到一个新的水平，并将工作拆分到大约 4 个节点上。我的qsub脚本看起来像这样：

有谁知道如何做到这一点？

python sungridengine qsub

2010-10-06T13:31:25.900

1 2 3 4 5 6 7 8 9 10

问题标签 [qsub]

Reference