我是 PIG 的新手,并试图解决多行输入(网站)的字数(网站)问题。例如我的输入数据集有值
输入数据
Email websites
e1 web1 web2 web3 web1 ....
e2 web2 web3 web2 web2 web4 ...
e3 web1 web2 web1 web4 .....
我想要的输出将是
Email websites
e1 web1(2) web2(1) web3(1) ....
e2 web2(3) web3(1) web4(1) ...
e3 web1(2) web2(1) web4(1) .....
在我的数据集中,我有近 50000 个电子邮件 ID(用户)