我在具有 SUSE Linux Enterprise Server 11 的 VMware 上以伪分布式模式安装 Hadoop。我能够运行 hello world 示例,例如字数统计。我还使用 WinSCP 连接到该 VM 并将几个 XML 文件上传到 hadoop 集群。
我现在的问题是如何配置我在 Windows 7 本地计算机上的 Eclipse 以连接该 VM 并编写一些 Java 代码来处理我在集群中转储的数据。我做了一些工作并且能够在 Eclipse 中获得 Map/Reduce 透视图,但无法弄清楚如何从我的本地机器连接虚拟机上的 hadoop,编写我的 java 代码(映射器、reducer 类)来处理数据并保存结果回到集群中。
如果有人可以帮助我,那就太好了。提前致谢。
如果需要更多信息,请告诉我。
我正在使用 hadoop-0.20.2-cdh3u5 和 eclipse europa 3.3.1