我想在 Apache Pig 中将数据转换为特定格式,以便我可以在其上使用报告工具。
例如:
10:00,abc
10:00,cde
10:01,abc
10:01,abc
10:02,def
10:03,efg
输出应采用以下格式:
abc cde def efg
10:00 1 1 0 0
10:01 2 0 0 0
10:02 0 0 1 0
这里的主要问题是一个值可以连续出现多次,具体取决于示例 csv 文件中可用的不同值,总共最多 120 个。
任何解决此问题的建议都非常受欢迎。
谢谢加根