问题标签 [torque]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何在扭矩集群器上查看 .jar 作业的进度
我正在.jar
扭矩集群上运行文件。它们将运行未知的时间。
我想在作业运行时检查作业的进度。我该怎么做呢?显然system.out.println
不起作用,如果在本地运行,我通常会使用它。
我使用 Ubuntu。
java - 如何检查qsub作业的命运
我已经.jar
在扭矩集群上运行了一个 qsub 作业(文件)并看到它完成了。但是输出不是预期的。如何查看此.jar
文件引发的任何错误消息(我将通过终端在本地查看它们 - 我想查看此类消息以诊断问题)。错误消息,例如 aRuntimeException
或特定的System.out.println
或System.out.err
boost - 使用扭矩使头节点上的本地共享库可用于计算节点
在这方面更复杂的问题已经在其他地方提出并得到了回答:这个问题可能太微不足道而无法提出。在集群中,我有一个程序编译并链接到 /usr/local/lib 中头节点上的共享 boost 库,这个 boost 版本比集群发行版中可用的版本更新。该程序在头节点上运行良好,因为我导出了 LD_LIBRARY_PATH。如果我尝试使用扭矩调度程序运行它,则库在计算节点上不可用,从而产生“加载共享库时出错......”。除了将 boost 重建为静态库并以这种方式链接程序之外,是否有一种简单的方法可以使这些库对所有节点都可用?只需在作业脚本中导出路径,即
不起作用,因为显然计算节点上不存在路径。这似乎是一个愚蠢的问题,但是让所有计算节点都可以使用头节点上的本地对象的最简单方法是什么?
java - 角速度和计算问题
所以,我的问题是,一旦一个形状获得了大量的角动量(任何视觉上明显的东西),那么碰撞就不再起作用了。它发生碰撞、减速,但不会像弹性一样反弹,也不会一次“冲动”,而是逐渐减速直到停滞。
我很确定这个问题与上面的代码直接相关,我在这里遵循方程式:http ://www.myphysicslab.com/collision.html
如果没有角速度,则不会发生问题,并且角速度越高越明显。我认为点函数的速度是问题的根源,但不确定原因。我已经进行了调试,没有发现太多,我认为这是对数学的误解。有谁知道我做错了什么?
pbs - 请求节点的所有处理器
我需要在 PBS 集群上运行一个 Java 应用程序,我有点不清楚它应该如何表现。
应用程序启动了几个线程,线程的数量取决于运行它的节点上的内核数量。然后每个内核启动 2 个线程。
对我来说最好的办法是请求对 PBS 集群中的一个节点的完全访问权限,以便让这个东西在上面运行。也就是说,保留一个节点上的所有核心。我还没有看到我怎么能做到这一点。我所看到的只是 ppn 参数,它请求每个节点的特定数量的核心,但节点是异构的,所以我不想指定单个 ppn 数字,这取决于我得到的节点类型。
如果这不可能,我需要了解指定 ppn 时作业的行为方式。我可以指示 Java 应用程序只创建 X 多个线程,但我认为我无法控制这些线程将在哪些内核上运行。每个核心创建 2 个线程对我们来说是一个经验法则,并且可能会发生所有线程都想一直运行的情况,在这种情况下,我使用的 CPU 资源将比我请求的多 100%。我的理解是否正确,即 PBS 不会对我的进程实施任何限制,但实际上可能会监控它,如果它超过指定的资源使用量,甚至会终止我的进程?
TL;博士;
所以总结一下:
- 我可以请求对节点的完全访问权限(保留节点上的所有内核用于工作)吗?
- 如果我只请求节点上的一小部分核心,如果超过该限制,PBS 会终止我的工作吗?
java - GWT 服务器应用程序无法连接到数据库
我在服务器端有一个基本服务,它只是在表上进行查找。该代码在隔离代码/ JUnit 测试上运行良好。
当我将它集成到服务器端时,我得到一个异常:
它看起来很像 Google AppEngine 的一些问题,但它没有在我的环境中激活。
我激活 GAE 看看会发生什么,我得到:
[..]
这完全有道理……
当我回到没有 AppEngine 的情况下,它仍然失败,就像我的第一个示例一样。
我不想在 AppEngine 上运行我的代码,这只是一个测试。
我不认为 Torque 实际上在这里做任何坏事......
pbs - PBS_Server:LOG_ERROR::set_nodes 中的未知节点 (15064),请求失败,请求损坏
我安装了 Torque 4.2.6,因为它支持 GPU。
每当我提交作业时,它都不会被执行,它总是留在队列中。
我的脚本是
它抛出以下错误:
如果上面的脚本是错误的,谁能告诉如何编写脚本来在 GPU 上执行作业
编辑
我在 /var/log/messages 中发现了以下错误
pbsnodes -a
bash - 从后台函数打印输出后如何返回 bash 提示符?
打印后台函数的输出后,如何自动返回到我的 bash 提示符?
例如,当我在 bash shell 中运行以下脚本时:
运行脚本后,它立即返回我的提示。10 秒后,它会打印“完成”,然后在新行上显示一个闪烁的光标:
该脚本不再运行,但在我按下 之前我不会收到提示Return。
打印“完成”后有什么方法可以强制返回到 bash 提示符?
一个相关的问题是:有没有办法让后台任务通知终端打印新的提示?但是,该问题询问的是后台程序。那里提供的答案适用于发送到后台的程序,但似乎不适用于发送到后台的函数(如我提供的示例中所示)。
澄清一下:我希望保存上面的整个代码片段(例如 as myscript.sh
),然后将其作为前台脚本运行(例如 as bash myscript.sh
)。
编辑:以上当然只是一个 MWE。这个问题的上下文是:
- 用户运行脚本
- 脚本提交 PBS 作业,开始在后台拖尾输出文件,并调用
fn &
- 用户得到提示,可能会开始做其他事情。
- 作业开始运行时,作业输出出现在用户终端上
fn
监视队列并tail
在作业完成时终止。- 用户抱怨Enter在此完成后没有得到提示(即,必须按 )。
这里有一些更简洁的代码:
当然,如果我的用户可以从单独的文件中获取作业输出,或者自己在前台和后台之间操作作业,那对我来说会容易得多,但他们不能。他们甚至无法按照脚本中的说明点击Enter以获取提示的“外观”......而且我无法打开另一个“窗口” - 他们没有显示服务器。
queue - Torque pbs_python 提交作业错误(15025 队列已存在)
我尝试执行这个示例脚本(https://oss.trac.surfsara.nl/pbs_python/wiki/TorqueUsage/Scripts/Submit)
但 shell 显示错误“15025 队列已存在”。使用 qsub 作业正常提交。我的服务器上有一个队列“批处理”。扭矩版本 - 4.2.7。pbs_python 版本 - 4.4.0。
我应该怎么做才能开始新工作?
pbs - 为可变工作流调整资源
我有一个需要通过过滤程序 A、B、C 和 D 运行的文件。A 需要 2 小时,B、C 和 D 各需要 10 到 30 分钟。
A 完成了大部分工作并花费了大部分时间,因此它被优化为使用多个处理器。
B、C 和 D 是单处理器。
所有程序都在一个 PBS 脚本中按顺序运行。
如果我在 A 运行后更改 pbs 资源需求,它会被重新解释还是 qsub 只评估一次?
或者,如果我把它分成两个 pbs 脚本,我怎样才能让一个在完成时启动另一个?