0

我有一个以下性质的 XML 文件。

<TREE>
 <SUBTREE> some_text1 </SUBTREE>
 <SUBTREE> some_text2 </SUBTREE>
</TREE>

我的集群中有 10 个节点,我希望每个映射器在每次调用“map”方法时都获得一个 SUBTREE,即当第一次调用 map 方法时,在所有 10 个节点上运行的映射能够访问第一个 SUBTREE元素,类似地,当第二次调用它时,所有 10 个节点都能够访问 XML 文件中的第二个 SUBTREE 元素。有没有办法可以做到这一点?

4

1 回答 1

0

没有可用的 OOB 功能来执行此操作。您必须为此编写自定义 InputFormat,以便根据您的要求实现记录读取器。您可能会发现此链接很有帮助: http ://www.undercloud.org/?p=408

于 2013-05-03T12:06:59.023 回答