我们的目标是利用 PIG 对我们的服务器日志进行大规模日志分析。我需要从文件中加载 PIG 地图数据类型。
我尝试使用以下数据运行示例 PIG 脚本。
我的 CSV 文件中有一行名为“test”(由 PIG 处理)看起来像,
151364,[ref#R813,highway#secondary]
我的猪脚本
a = LOAD 'test' using PigStorage(',') AS (id:INT, m:MAP[]);
DUMP a;
这个想法是加载一个 int 和第二个元素作为 hashmap。但是,当我转储时,int 字段被正确解析(并在转储中打印),但 map 字段未解析,导致解析错误。
如果我遗漏了什么,有人可以解释一下吗?