我正在开发一个基于 java 的应用程序;其相关要求如下
大型数据集存在于网络上的多台机器上。我的程序需要(远程)执行一个 java 程序来处理这些数据集并获取结果
Windows 桌面上的用户需要在机器 A 上处理数据集(几个 gig)。我的程序可以驻留在用户的机器上。他将从他的机器上执行我的程序并在远程机器上启动数据集处理
他不会通过网络从远程机器获取数据集到他的机器,而是在远程机器上执行程序并获取结果
用户可能对其他机器具有开放访问权限,但需要 ftp
数据不应该通过网络传送到用户的机器上。
用户有windows操作系统
我的问题
如何执行这种远程进程执行?有任何想法吗?
我在看hadoop;我正在使用 Windows XP。我无法让 hadoop 为单节点集群工作;我找不到好的文档。因此,我还没有完全测试过 hadoop。如果我走在正确的轨道上,有什么意见吗?
你们中的任何人发现任何对安装 hadoop 和故障排除有用的链接?
提前感谢您的任何回复。请让我知道我是否应该提供更多/具体的细节。
-jv