“grid-computing”的相关标签问题

0 投票

1 回答

71 浏览

cluster-computing - 量子和分子动力学包和排队系统

从 Quantum 和 Molecular Dynamics 软件包的扩展列表中，哪些可以轻松“互连”到与排队系统 PBS 和 Sun Grid Engine 一起工作的集群？

或者是否有一些程序或方法允许以 PBS 或 SGE 方式“打包”所有工作？

谢谢

cluster-computing grid-computing

2009-12-20T18:38:12.677

0 投票

2 回答

721 浏览

java - Hadoop 中的动态节点

Hadoop启动后是否可以添加新节点？我知道您可以删除节点（因为主节点倾向于密切关注节点状态）。

2010-01-21T21:10:40.793

0 投票

3 回答

2485 浏览

java - 是否有适用于 Torque/PBS 的 DRMAA Java 库？

有人知道已知可与 PBS/Torque 集群软件一起使用的 DRMAA-API 的 Java 实现吗？

这背后的背景：我想使用符合 DRMAA 的 API 从 Java 将作业提交到新设置的 linux 集群。集群由PBS/Torque管理。Torque 包括用于 Torque/PBS 的 PBS DRMAA 1.0 库，其中包含 DRMA-C 绑定并在 libdrmaa.so 和 .a 二进制文件中提供。我知道 Sun Grid Engine 包含一个提供 Java-DRMAA API 的 drmaa.jar。事实上，我选择使用 SGE，但决定先尝试 PBS。

该决定背后的理论是：
“DRMAA 是一种标准，因此 Java API 只需要符合标准的 drmaa-c 绑定。” 但是，我找不到这样的“通用 DRMAA-C-java API”，现在假设这个假设是错误的，并且 Java 库是特定于引擎的。

编辑：我刚刚尝试了来自 sun Grid Engine 包的 drmaa.jar，并尝试将它与 pbs libdrmaa.so 交叉使用。毫不奇怪，那失败了（JNI unsatisfied link error）。

结论：这样不行！经过一番搜索，我只看到以下几个选项：

在 Globus 工具包上安装 GridWay。安装在 PBS 之上的 GridWay 声称以 Java 提供 DRMAA。对于我的设置来说，看起来太复杂了。
报废 DRMAA，通过从 Java 调用系统命令 qsub、qstat 等提交给 PBS。简单但不是很好。
自己实现一个 drmaa 绑定。太复杂了...
切换到网格引擎。在我看来，GE 在语言绑定方面优于 PBS。

我倾向于选择选项 2。或 4。有什么建议吗？

java cluster-computing pbs grid-computing drmaa

2010-04-26T16:51:13.007

0 投票

1 回答

271 浏览

cluster-computing - 使用 sun Grid Engine 运行大量作业

我想使用 Sun Grid Engine 运行大量（约 30000 个）作业。

我理论上可以执行 30000 次“qsub”命令来提交作业。但是，我担心这会太多。

有更好的方法吗？（即来自文件）否则，您认为它仍然可以工作吗？

谢谢

cluster-computing grid-computing sungridengine

2010-06-17T15:46:45.283

0 投票

1 回答

193 浏览

grid-computing - 如何在网格上运行实时应用程序

我正在使用 Delphi++，它仍处于测试阶段并且文档不是很好，如何让我使用 Delphi++ 创建的实时应用程序在 Grid/Cloud 上运行？以及我的客户如何开始在他们的计算机上使用它？

grid-computing

2010-07-14T09:32:11.493

0 投票

1 回答

493 浏览

ruby-on-rails - 扩展 Ruby on Rails 站点

我正在开发一个 Ruby On Rails 应用程序，并希望在生产环境中进行部署。我有多个可以使用的相同配置的 Ubuntu Web 服务器，但我不知道如何跨多个主机扩展 RoR 应用程序和数据库数据。

我想在每台主机上同时放置一个 Web 服务器和一个数据库服务器。

在 web 服务器/ruby 中间件方面，我希望会话由主 web 服务器控制，该服务器在 web 服务器/ruby 中间件层上进行负载平衡。它应该将新会话移交给免费主机。

我需要在 Web 服务器/ruby 中间件端进行负载平衡。Web/中间件会话应该是原子的（我对跨多个主机复制它们不感兴趣）

我希望将尚未保存到数据库的事务数据记录到中间重做日志中——以便在故障恢复的情况下重新运行。

在数据库层：

我希望将任何一台主机上的数据库数据复制到另外两台主机。（每个 DB 集有 3 个 DB 主机）

我不想在所有主机上复制数据库数据，因为它需要太长时间——延迟。

我想制定一个算法，将“创建”类型的请求定向到正确的数据库。我想到了负载平衡。

DB 主控制器应该知道哪个 3-DB 集用于“更新/读取/删除”请求。

我的测试网络服务器是 webrick，后端数据库是 Postgresql（尽管这与 RoR 无关）。

我相信我需要将 sessionId 绑定到每个事务并保留重做日志，以防我需要在失败后重新加载该会话。

我可能会遇到哪些其他设计问题？另外，我应该使用什么网络服务器和数据库服务器来完成繁重的工作？主数据库和主 Web 服务器有哪些好的选择？

我知道这是一个跨越多个知识领域的复杂问题。我想知道我所问的是否可能。

ruby-on-rails linux scalability cluster-computing grid-computing

user78706

2010-08-04T22:23:00.683

0 投票

2 回答

496 浏览

parallel-processing - 使用 GridGain 连接到网格集群

我知道 GridGain 通过多播连接到其他客户端开箱即用，但是有没有办法将 GridGain 配置为接受本地网络之外的连接？还有一种方法可以为通信启用加密吗？

parallel-processing grid-computing gridgain

2010-08-05T02:09:34.707

0 投票

4 回答

33779 浏览

linux - 以 qsub 开头的 shell 脚本的参数

如何参数化在网格上执行的 shell 脚本（以 qsub 开头）？我有一个 shell 脚本，我使用 getopts 来读取参数。

当我使用 qsub 启动 (qsub script.sh -r firstparam -s secondparam ..) 这个工作脚本时，我收到错误消息，

qsub: 无效选项 -- s

qsub: 非法 -r 值

因为 qsub 认为参数是为自己的。然而我还没有找到任何解决方案。

谢谢

linux shell grid-computing qsub

2010-08-17T15:22:54.220

0 投票

1 回答

595 浏览

r - 在网格计算环境中运行 R 作业

我在网格计算环境中在 R 中运行一些大型回归模型。据我所知，网格只是给了我更多的内存和更快的处理器，所以我认为这个问题也适用于那些在功能强大的计算机上使用 R 的人。

我正在运行的回归模型有很多观察结果，以及几个因子变量，每个变量都有很多（10 或 100）个水平。因此，回归可能会变得计算密集。我注意到，当我在脚本中排列 3 个回归并将其提交到网格时，由于内存限制，它会退出（崩溃）。但是，如果我将它作为 3 个不同的脚本运行，它运行良好。

我正在做一些清理工作，所以在每个模型运行后，我将模型对象保存到一个单独的文件 rm(list=ls()) 以清除所有内存，然后在运行下一个模型之前运行 gc()。尽管如此，在一个脚本中运行所有三个似乎都会崩溃，但拆分工作似乎很好。

系统管理员说打破它很重要，但我不明白为什么，如果我在每次运行后进行清理。3 in one script 无论如何都会按顺序运行它们。有谁知道为什么运行三个单独的脚本有效，但是在一个脚本中运行所有模型会导致 R 出现内存问题？

谢谢！外泄

r memory-management grid-computing

2010-10-05T14:12:38.030

0 投票

2 回答

16318 浏览

grid-computing - 虚拟机和云计算

大家好，我是 IT 领域的新手，谁能解释一下虚拟机和云计算之间的关系。在我的公司中，他们使用 ubuntu eucalyptus 工具使用私有云。他们使用 KVM。当我需要他们说我们会给你的资源时，虚拟机是云计算意味着提供虚拟机，因为我通过网络学习云计算，这听起来像是一种不同的技术。更重要的是我想知道虚拟机的规格（特性）是否取决于物理机？他们正在模仿，或者我们可以提供我们的规范，例如在物理机只有 20 GB 硬盘的情况下制作 100 GB 存储的虚拟机？或者是否可以将虚拟机制作为 0f 4 GB RAM 而物理机的虚拟机有 128 mb 的 ram 请解释一下这个概念我会永远感谢你们所有人

grid-computing

2010-11-10T05:59:37.343

问题标签 [grid-computing]

Reference