我想在 pig 中解析这样的 XML 文件:
<person>
<name>person1</name>
<exp>blablabla</exp>
<exp>blablabla</exp>
</person>
<person>
<name>person2</name>
<exp>blablabla</exp>
<exp>blablabla</exp>
<exp>blablabla</exp>
</person>
我已经写了一个 JAVA 程序,它会产生这个输出:
- 第一个文件,其中包含人名和他们的 id 之间的映射:
1,人1
2,人2
然后我可以使用这个 pig 命令将文件加载到变量中:
A = 加载 '...' AS (id_person:int, name:chararray);
- 映射人员及其经验的第二个文件
1,1,blablabla
1,2,blablabla
2,1,blablabla
2,2,blablabla
2,3,blablabla
我以这种方式加载文件:
B = 加载'...' AS (id_person:int, id_exp:int, text:chararray);
我想做同样的事情,但只使用猪。可能吗 ?
谢谢