我正在使用 UDF 来处理 Hadoop 集群上的 XML 文件。我正在使用 PIG 加载 XML 文件,然后使用我的 UDF 来展平 XML 数据的结构。
我当前的实现是使用 DOM 解析器,我不必将 DOM 解析器 jar 与我的 udf jar 一起包含。我计划将此实现从 DOM 解析器转移到 SAX 解析器。
hadoop/pig 框架是开箱即用地为 SAX 解析器提供这些 jar,还是我需要将它们与我的 udf jar 一起包含在内?
我正在使用 UDF 来处理 Hadoop 集群上的 XML 文件。我正在使用 PIG 加载 XML 文件,然后使用我的 UDF 来展平 XML 数据的结构。
我当前的实现是使用 DOM 解析器,我不必将 DOM 解析器 jar 与我的 udf jar 一起包含。我计划将此实现从 DOM 解析器转移到 SAX 解析器。
hadoop/pig 框架是开箱即用地为 SAX 解析器提供这些 jar,还是我需要将它们与我的 udf jar 一起包含在内?