我们如何使用 apache pig 运行 XML。我尝试了 piggybank.storage.XMLLoader 函数,但它对我不起作用。我只在本地模式下运行猪作业。没有错误,但它没有运行。
有没有办法解析 apache pig 中的 HTML 页面。
请帮我。
提前致谢
我们如何使用 apache pig 运行 XML。我尝试了 piggybank.storage.XMLLoader 函数,但它对我不起作用。我只在本地模式下运行猪作业。没有错误,但它没有运行。
有没有办法解析 apache pig 中的 HTML 页面。
请帮我。
提前致谢
您需要将 org.apache.pig.piggybank.storage.XMLLoader() 与参数一起使用。和 Xpath 也是如此。我发现这个很有帮助。
请尝试在 MR 模式下运行脚本。因为许多功能/操作只能在 MR 模式下正常工作。
试试这个代码:
register <PIG_HOME>/contrib/piggybank/java/piggybank.jar;
A= LOAD '/xmlfile' USING org.apache.pig.piggybank.storage.XMLLoader('<XML_tag>');
猪 MR 模式是指在 MR 模式而不是本地模式下运行 pig(即 pig -x local)。
希望能帮助到你。