问题标签 [lsf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何在一个作业 ID 下向 LSF 提交多个命令?
我有大约 3,500 个作业正在运行Beagle
以使用bsub
. 由于我使用的服务器在公平共享排队系统上运行,因此我不愿意通过单独运行每个作业来降低排队优先级。
因此,我试图在单个命令中使用 for 循环来运行我的bsub
命令...
...但我刚刚收到错误消息:
意外标记“do”附近的语法错误
我听说过 blaunch 命令,据我所知,它会接受每项工作并在一个工作 ID 下提交它们,但我无法弄清楚如何将它集成到我的命令中而不会收到相同的错误消息。据我所知,它应该在 for 循环之前插入。
有没有人能告诉我我的语法哪里出了问题,或者建议在一个作业 ID 下提交批处理任务的替代方法?
非常感谢,
伊恩
linux - 命令替换问题(变量为空)
在 shell 脚本中进行命令替换时遇到一些问题。我之前在另一个系统上使用过这个脚本,所以不确定这里发生了什么。似乎无论我如何附上设置变量的命令,我都会得到一个空变量。我尝试了许多不同的方法来将它们括起来($()
、反引号、引号)。如果有帮助,我正在尝试提交一个数组作业。
$mem
设置正确,与sample
线路有关。该echo
命令打印一个空行。
c - 非常奇怪的错误***检测到glibc** free() 无效指针
我看到有很多与此相关的问题,但我没有找到与我相似的问题。我在 LSF 平台上运行一个用 C 和 Fortran 混合编写的模型。连线的事情是我的模型运行良好,直到上周它开始抛出这个错误。甚至连线都是错误不会每次都发生:有时,模型可以运行(没有错误),有时在尝试读取输入文件时作业会中止。错误指向我从未修改过的代码到目前为止我已经尝试过:
1)重新编译源代码并使用新创建的可执行文件;
2)从另一个运行良好的目录复制可执行文件;
3)删除整个目录,新建一个目录,重复以上两步;
4)从新登录开始
5)每次只运行1个作业,排除同节点上运行的其他作业影响的可能性
6)更改工作名称
7)改变运行长度(车型年)
并且错误仍然发生 90% 的时间。错误指向 inpakC.c 文件(我在下面附加了文件的一部分)'free(line)' 部分。我看不出有什么问题,因为它是预先编写的代码。任何帮助或建议将不胜感激!
cluster-computing - LSF - BSUB 如果作业被终止,则运行脚本
我正在使用 LSF,运行 bsub 命令。
我正在实现 -Ep 开关来运行 post exec 脚本。在作业被终止或达到内存限制、运行限制等之前,这非常有效。
有没有办法让作业检测到资源耗尽然后运行脚本?还是强制它运行脚本,即使它被杀死?
我想我的另一个选择是运行依赖于该作业的作业,该作业将在完成时运行“post exec”脚本。
有什么想法吗?
亲切的问候,
大剥皮者
r - 恢复不完整的 PDF 文件
考虑下面的代码,它在一个有壁挂时间的集群上运行(#BSUB -W 10:00):
上面的代码在竞争 for 循环之前退出,(因为 walltime)并且 PDF 不完整。然后,我用这个网站恢复,所以绘图数据在文件中,只是不完整。
有没有其他方法可以恢复?也许在 PDF 文件中添加一些文本(使用文本编辑器)以使 PDF 文件完整?
lsf - Change priorities of my own submitted jobs
I have many jobs running and pending. I would like to indicate the relative priority of jobs that I have submitted to the queue, that are pending, but not yet running. Is it possible to set this priority after submission? Is it possible to set this priority before submission?
lsf - 为什么我有更多的工作“开始”而不是运行或暂停?
根据bqueues
手册页:
根据bqueues
,我有 369 个工作开始:
但是当我运行时bjobs
,它只显示 24 个正在运行或暂停的作业:
什么解释了 24 个正在运行的作业和 369 个已启动的作业之间的差异?
python - 如果 LSF 在多个节点上启动单个 Python 作业,会发生什么?
使用 LSF,我使用-n N
where N>1 提交了一个 Python 作业。这意味着它将使用多个核心,这些核心可能位于也可能不在同一节点上。我没有为进程间通信编写任何显式代码,但我确实使用了可以利用多个内核的库,例如numpy
、scipy
和numexpr
.
我很困惑,因为 LSF 告诉我我的脚本分布在多个节点上,即不同的物理机器上,但我的代码没有考虑到这一点。LSF 在这种情况下实际上在做什么,如果它在不同的机器上使用多个内核,而不是在同一个节点上使用多个内核,那么实际的含义是什么?
bash - 只有在我以前的所有工作都完成后才能运行工作
我找到了一篇文章,说明我如何告诉 bsub 在运行here之前等待一组指定的作业完成,但是这只有在事先知道作业数量的情况下才有效。
我想运行任意数量的作业,并在所有作业完成后运行“包装”作业
这是我的脚本:
当提交了 3 个作业时,上面的脚本将起作用,但是如果有 n 个作业呢?如何指定我要等待所有作业完成?
shell - bsub 后处理脚本
我正在编写一个使用 bsub 命令在集群中提交并行作业的脚本
如何在所有测试运行结束时编译结果?