问题标签 [qsub]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 在 matlab r2012a 中使用 qsub 提交作业
我正在运行一个代码,其中包含一个循环,我在其中拆分任务并使用qsub作为不同的作业发送它。例如,我打电话给:
我的交叉有效函数如下:
但是在我运行我的 searchweights 函数之后,qsub 命令似乎根本没有运行,即它没有进入“crossvalid”函数。它在错误文件中给出了这个错误:/data5/natraj/matlab2012a/bin/matlab: No match。
*(/data5/natraj/matlab2012a/bin/matlab 是我的 matlab 可执行文件)
我没有得到真正导致此错误的原因,我该如何排除?
操作系统是Linux。
编辑:问题似乎出在 qsub 上。当我使用 parfor 运行相同的 for 循环时,它正在运行。
queue - 作业提交后立即进入退出状态
我正在使用 PBS 队列,有一个队列,当我提交作业时,它立即进入退出状态,并且没有可用的输出/错误文件(例如,没有 do.sh.exxxxxxxxx 和 do.sh.oxxxxxxx)
当我使用python提交一系列作业时,一些作业会进入R状态几秒钟,然后进入退出状态。那些已经进入 R 状态的将有输出/错误文件
错误文件显示
tput: No value for $TERM and no -T specified
/var/spool/torque/mom_priv/jobs/9282194.redwood.speech.cs.cmu.edu.SC: Command not found.
队列本身应该没问题,因为其他人正在愉快地提交作业,但我什至无法提交作业。我使用的脚本也可以在其他机器上使用,所以我相信脚本应该没问题。我只是不知道为什么有一个我不能提交的特定机器。
感谢您阅读这篇文章,非常感谢您的帮助。
arrays - $SGE_TASK_ID 未使用 qsub 数组网格作业设置
使用一个非常简单的zsh
脚本:
$SGE_TASK_ID
是 sun-grid 引擎任务 ID。我正在使用 qsub 提交一系列作业。
我正在遵循 qsub 手册页 ( http://www.clusterresources.com/torquedocs/commands/qsub.shtml#t ) 中的建议,并将我的数组作业提交为
$SGE_TASK_ID 没有为此数组作业设置...有没有人知道为什么?
谢谢!
batch-file - 如何为 Intel ManyCore Lab 批处理作业提供控制台输出?
我目前正在英特尔的 ManyCore 测试实验室计算机上测试 OpenMP 并行程序,并且一直在使用
添加作业并运行它。它将程序的输出放入名为 myjob.o123456 的文件中(其中的数字取决于作业 ID),但我希望它在作业运行时输出到控制台,这样我就可以弄清楚进度我的程序正在制作。有人知道怎么做这个吗?
command-line - 使用文件 *.dat 从父文件夹运行 qsub 命令到下面的所有目录
我正在使用 Redhat 和 pbs 排队系统将作业提交给有限元分析代码。我通常有一个文件夹,其中包含一个 .dat 文件,这是我要运行的文件,以及一个将提交 .dat 文件的 .pbs 文件。要提交 .dat 文件,我将在包含这两个文件的目录中运行命令“qsub *.pbs”。
我如何从包含 .dat 文件的目录之外提交或只运行“qsub *.pbs”。我通常是 .dat 文件的两个目录。
谢谢
python - 如何迭代地进行 qsub 作业
如何迭代地进行 qsub 工作?
让一个变量 i=2:10,对于每个 i,我想运行“tmp.r”并在进入下一个 i 之前暂停 10 秒。我的脚本名称是 test.pbs。我试过这个:
但是这个提交的工作将立即返回..
我想在 Cray XE6 上运行它。我的 R 代码使用了遍历算法,所以迭代提交作业会提高效率。
知道如何用 bash 或 python 做到这一点吗?
谢谢!
python - os.system vs linux上python中的子进程
我有两个 python 脚本。第一个脚本调用第二个脚本表,我需要在其中执行第三方 python 脚本。它看起来像这样:
所以在这里我将 10 个作业发送到队列中。在脚本 2 中,我有一个基于 task_id 的 case 语句。在每一个中,我都使用不同的参数对第三方脚本进行了类似的调用。
这就是我的问题所在。使用其中一种有区别/好处吗?我知道由于支持问题,在 Windows 上使用一个在另一个上会产生很大的不同,但我在 linux 上并且无意在 Windows 上运行它。有时我从使用子进程中得到非常奇怪的结果,当第三个脚本一次一个独立地运行时,它无法在网络上找到其他东西。
variables - 未找到 SGE 命令,未定义变量
我正在尝试设置一个新的计算集群,目前在 SGE 中使用 qsub 命令时遇到错误。这是一个显示问题的简单实验:
测试.sh
测试.sh.eXX
测试=你好:找不到命令。
测试:未定义的变量。
测试.sh.oXX
警告:无法访问 tty(错误的文件描述符)。
因此在这个 shell 中没有作业控制。
如果我在头节点 (sh test.sh) 上运行脚本,则输出是正确的。我通过键入“qsub test.sh”将作业提交给 SGE。
如果我在已建立的计算集群(如 HPC)上以相同的方式提交完全相同的脚本作业,它会按预期完美运行。什么设置可能导致此问题?
感谢您对此事的任何帮助。
bash - qsub 将参数传递给 -N (name) 选项
我正在提交一堆采用一系列参数值的 qsub 作业。我运行以下循环来提交这些多个作业。我通过-v将具体的参数值传递给qsub。我希望 jobname 也是这些参数的函数:
其中 run_file.sh 包含运行程序的#PBS 命令。当我提交到服务器时,我看到以下输出表明循环正常工作:
但作业名称仅与最后一个参数一起出现
而不是作为
如何让作业名包含两个参数?我尝试缩短文件名以确认这不是长度问题。我希望名称与两个参数一起出现,以跟踪哪些文件仍在运行,而无需检查输出文件。谢谢你的帮助。
linux - 扭矩嵌套/连续 qsub 调用
我有一个compile.pbs
在单个 CPU 上运行并编译源代码以创建可执行文件的作业脚本。然后我有一个第二个作业脚本jobscript.pbs
,我使用 32 个 CPU 调用它来使用 MPI 运行新创建的可执行文件。当我连续手动调用它们时,它们都可以完美地工作,但我想通过让第一个脚本在它结束之前调用第二个作业脚本来自动化这个过程。有没有办法正确嵌套 qsub 调用或让它们被连续调用?
目前我的尝试是让第一个脚本在它结束之前调用第二个脚本,但是当我尝试从第二个(嵌套)qsub 收到一条奇怪的错误消息时:
我认为第二个脚本被正确调用,但权限可能与我调用原始脚本时的权限不同。显然,我的用户名masterhd
被允许运行作业脚本,因为当我手动调用作业脚本时它工作正常。有没有办法完成我想做的事情?
这是该过程的更详细示例。首先,我调用第一个作业脚本并指定一个变量-v
:
该outpath
变量仅指定复制新可执行文件的位置,然后第二个作业脚本更改到该输出目录并尝试运行jobscript.pbs
.
编译.pbs:
作业脚本.pbs: