0

我们如何使用 apache pig 运行 XML。我尝试了 piggybank.storage.XMLLoader 函数,但它对我不起作用。我只在本地模式下运行猪作业。没有错误,但它没有运行。

有没有办法解析 apache pig 中的 HTML 页面。

请帮我。

提前致谢

4

3 回答 3

1

您需要将 org.apache.pig.piggybank.storage.XMLLoader() 与参数一起使用。和 Xpath 也是如此。我发现这个很有帮助。

于 2017-10-26T11:56:20.493 回答
0

请尝试在 MR 模式下运行脚本。因为许多功能/操作只能在 MR 模式下正常工作。

于 2013-03-21T09:33:10.343 回答
0

试试这个代码:

register <PIG_HOME>/contrib/piggybank/java/piggybank.jar; 
A= LOAD '/xmlfile' USING org.apache.pig.piggybank.storage.XMLLoader('<XML_tag>');

猪 MR 模式是指在 MR 模式而不是本地模式下运行 pig(即 pig -x local)。

希望能帮助到你。

于 2013-04-16T12:44:23.283 回答