0

我正在使用 UDF 来处理 Hadoop 集群上的 XML 文件。我正在使用 PIG 加载 XML 文件,然后使用我的 UDF 来展平 XML 数据的结构。

我当前的实现是使用 DOM 解析器,我不必将 DOM 解析器 jar 与我的 udf jar 一起包含。我计划将此实现从 DOM 解析器转移到 SAX 解析器。

hadoop/pig 框架是开箱即用地为 SAX 解析器提供这些 jar,还是我需要将它们与我的 udf jar 一起包含在内?

4

1 回答 1

0

我的错。我开始研究 SAX 解析器。他们只是随之而来。

于 2013-05-23T14:52:06.607 回答