我有两个数据集 Customer 和 Goods。客户数据集将客户 ID 作为键,并将客户购买的商品 ID 列表作为价值。Goods 数据集将其作为关键,将其价格作为价值。如何根据外键商品id加入这两个数据集?
customer dataset:
customer id, goods id1,goods id2, ...
goods dataset
goods id1, price1
goods id2, price2
The join result dataset I want:
customer id1,price1,price2,...
customer id2,pric3e,price4,...
我是 hadoop 的新手。我知道它可以在 Pig 和 Hive 中完成,但我想用 Hadoop 在 java 中实现它。有谁能够帮我?非常感谢!