问题标签 [grid-computing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cluster-computing - 量子和分子动力学包和排队系统
从 Quantum 和 Molecular Dynamics 软件包的扩展列表中,哪些可以轻松“互连”到与排队系统 PBS 和 Sun Grid Engine 一起工作的集群?
或者是否有一些程序或方法允许以 PBS 或 SGE 方式“打包”所有工作?
谢谢
java - Hadoop 中的动态节点
Hadoop启动后是否可以添加新节点?我知道您可以删除节点(因为主节点倾向于密切关注节点状态)。
java - 是否有适用于 Torque/PBS 的 DRMAA Java 库?
有人知道已知可与 PBS/Torque 集群软件一起使用的 DRMAA-API 的 Java 实现吗?
这背后的背景:我想使用符合 DRMAA 的 API 从 Java 将作业提交到新设置的 linux 集群。集群由PBS/Torque管理。Torque 包括用于 Torque/PBS 的 PBS DRMAA 1.0 库,其中包含 DRMA-C 绑定并在 libdrmaa.so 和 .a 二进制文件中提供。我知道 Sun Grid Engine 包含一个提供 Java-DRMAA API 的 drmaa.jar。事实上,我选择使用 SGE,但决定先尝试 PBS。
该决定背后的理论是:
“DRMAA 是一种标准,因此 Java API 只需要符合标准的 drmaa-c 绑定。” 但是,我找不到这样的“通用 DRMAA-C-java API”,现在假设这个假设是错误的,并且 Java 库是特定于引擎的。
编辑:我刚刚尝试了来自 sun Grid Engine 包的 drmaa.jar,并尝试将它与 pbs libdrmaa.so 交叉使用。毫不奇怪,那失败了(JNI unsatisfied link error)。
结论:这样不行!经过一番搜索,我只看到以下几个选项:
- 在 Globus 工具包上安装 GridWay。安装在 PBS 之上的 GridWay 声称以 Java 提供 DRMAA。对于我的设置来说,看起来太复杂了。
- 报废 DRMAA,通过从 Java 调用系统命令 qsub、qstat 等提交给 PBS。简单但不是很好。
自己实现一个 drmaa 绑定。太复杂了...
切换到网格引擎。在我看来,GE 在语言绑定方面优于 PBS。
我倾向于选择选项 2。或 4。有什么建议吗?
cluster-computing - 使用 sun Grid Engine 运行大量作业
我想使用 Sun Grid Engine 运行大量(约 30000 个)作业。
我理论上可以执行 30000 次“qsub”命令来提交作业。但是,我担心这会太多。
有更好的方法吗?(即来自文件)否则,您认为它仍然可以工作吗?
谢谢
grid-computing - 如何在网格上运行实时应用程序
我正在使用 Delphi++,它仍处于测试阶段并且文档不是很好,如何让我使用 Delphi++ 创建的实时应用程序在 Grid/Cloud 上运行?以及我的客户如何开始在他们的计算机上使用它?
ruby-on-rails - 扩展 Ruby on Rails 站点
我正在开发一个 Ruby On Rails 应用程序,并希望在生产环境中进行部署。我有多个可以使用的相同配置的 Ubuntu Web 服务器,但我不知道如何跨多个主机扩展 RoR 应用程序和数据库数据。
我想在每台主机上同时放置一个 Web 服务器和一个数据库服务器。
在 web 服务器/ruby 中间件方面,我希望会话由主 web 服务器控制,该服务器在 web 服务器/ruby 中间件层上进行负载平衡。它应该将新会话移交给免费主机。
我需要在 Web 服务器/ruby 中间件端进行负载平衡。Web/中间件会话应该是原子的(我对跨多个主机复制它们不感兴趣)
我希望将尚未保存到数据库的事务数据记录到中间重做日志中——以便在故障恢复的情况下重新运行。
在数据库层:
我希望将任何一台主机上的数据库数据复制到另外两台主机。(每个 DB 集有 3 个 DB 主机)
我不想在所有主机上复制数据库数据,因为它需要太长时间——延迟。
我想制定一个算法,将“创建”类型的请求定向到正确的数据库。我想到了负载平衡。
DB 主控制器应该知道哪个 3-DB 集用于“更新/读取/删除”请求。
我的测试网络服务器是 webrick,后端数据库是 Postgresql(尽管这与 RoR 无关)。
我相信我需要将 sessionId 绑定到每个事务并保留重做日志,以防我需要在失败后重新加载该会话。
我可能会遇到哪些其他设计问题?另外,我应该使用什么网络服务器和数据库服务器来完成繁重的工作?主数据库和主 Web 服务器有哪些好的选择?
我知道这是一个跨越多个知识领域的复杂问题。我想知道我所问的是否可能。
parallel-processing - 使用 GridGain 连接到网格集群
我知道 GridGain 通过多播连接到其他客户端开箱即用,但是有没有办法将 GridGain 配置为接受本地网络之外的连接?还有一种方法可以为通信启用加密吗?
linux - 以 qsub 开头的 shell 脚本的参数
如何参数化在网格上执行的 shell 脚本(以 qsub 开头)?我有一个 shell 脚本,我使用 getopts 来读取参数。
当我使用 qsub 启动 (qsub script.sh -r firstparam -s secondparam ..) 这个工作脚本时,我收到错误消息,
qsub: 无效选项 -- s
qsub: 非法 -r 值
因为 qsub 认为参数是为自己的。然而我还没有找到任何解决方案。
谢谢
r - 在网格计算环境中运行 R 作业
我在网格计算环境中在 R 中运行一些大型回归模型。据我所知,网格只是给了我更多的内存和更快的处理器,所以我认为这个问题也适用于那些在功能强大的计算机上使用 R 的人。
我正在运行的回归模型有很多观察结果,以及几个因子变量,每个变量都有很多(10 或 100)个水平。因此,回归可能会变得计算密集。我注意到,当我在脚本中排列 3 个回归并将其提交到网格时,由于内存限制,它会退出(崩溃)。但是,如果我将它作为 3 个不同的脚本运行,它运行良好。
我正在做一些清理工作,所以在每个模型运行后,我将模型对象保存到一个单独的文件 rm(list=ls()) 以清除所有内存,然后在运行下一个模型之前运行 gc()。尽管如此,在一个脚本中运行所有三个似乎都会崩溃,但拆分工作似乎很好。
系统管理员说打破它很重要,但我不明白为什么,如果我在每次运行后进行清理。3 in one script 无论如何都会按顺序运行它们。有谁知道为什么运行三个单独的脚本有效,但是在一个脚本中运行所有模型会导致 R 出现内存问题?
谢谢!外泄
grid-computing - 虚拟机和云计算
大家好,我是 IT 领域的新手,谁能解释一下虚拟机和云计算之间的关系。在我的公司中,他们使用 ubuntu eucalyptus 工具使用私有云。他们使用 KVM。当我需要他们说我们会给你的资源时,虚拟机是云计算意味着提供虚拟机,因为我通过网络学习云计算,这听起来像是一种不同的技术。更重要的是我想知道虚拟机的规格(特性)是否取决于物理机?他们正在模仿,或者我们可以提供我们的规范,例如在物理机只有 20 GB 硬盘的情况下制作 100 GB 存储的虚拟机?或者是否可以将虚拟机制作为 0f 4 GB RAM 而物理机的虚拟机有 128 mb 的 ram 请解释一下这个概念我会永远感谢你们所有人