我想使用 Pig 加载 Hive 表。我认为我们可以做到这一点,HCatLoader
但我正在使用 xml 文件来加载 pig。为此,我必须使用XMLLoader
. 我可以使用两个选项在 Pig 中加载 XML 文件吗?
我正在使用我自己的 UDF 从 XML 文件中提取数据,一旦我们提取了所有数据,我必须将 Pig 数据加载到 Hive 表中。
我不能使用 HIVE 来提取 XML 数据,因为我收到的 XML 非常复杂,我编写了自己的 UDF 来解析 XML。任何建议或指示我们如何使用 PIG 数据加载 Hive 表。
我正在使用 AWS。