0

我正在开发一个基于 java 的应用程序;其相关要求如下

  • 大型数据集存在于网络上的多台机器上。我的程序需要(远程)执行一个 java 程序来处理这些数据集并获取结果

  • Windows 桌面上的用户需要在机器 A 上处理数据集(几个 gig)。我的程序可以驻留在用户的机器上。他将从他的机器上执行我的程序并在远程机器上启动数据集处理

  • 他不会通过网络从远程机器获取数据集到他的机器,而是在远程机器上执行程序并获取结果

  • 用户可能对其他机器具有开放访问权限,但需要 ftp

  • 数据不应该通过网络传送到用户的机器上。

  • 用户有windows操作系统

我的问题

  • 如何执行这种远程进程执行?有任何想法吗?

  • 我在看hadoop;我正在使用 Windows XP。我无法让 hadoop 为单节点集群工作;我找不到好的文档。因此,我还没有完全测试过 hadoop。如果我走在正确的轨道上,有什么意见吗?

  • 你们中的任何人发现任何对安装 hadoop 和故障排除有用的链接?

提前感谢您的任何回复。请让我知道我是否应该提供更多/具体的细节。

-jv

4

2 回答 2

1

假设您可以在远程机器上运行 JAVA VM,Java 有一个您可以使用的 RMI API。这是最轻的解决方案。下一个最轻量级的将是直接套接字通信。之后,您将进入 EJB 服务器或 Web 服务器,这可能是矫枉过正。

于 2010-01-14T23:42:29.197 回答
0

看看如何使用 Java 6 编写 Web 服务。这允许您将方法发布为带有注释的 Web 服务。Web 服务客户端很小,不需要额外的软件。我发现 Idea IntelliJ IDE 易于使用,并生成了一个纯 Java 6 客户端。

然后它基本上归结为进行“正常”方法调用并处理结果。

把事情简单化。网格软件很可能不是您想要的。

于 2010-01-15T00:03:23.667 回答