我需要在级联 hadoop 中创建一个缓冲区。
假设我有字段:
member_id,amountpaid,diadnosis_id,diagnosis_description,superGrouper_id,superGrouper_description,grouperId,grouperDescription
我需要
member_id
对来自和的字段进行分组superGrouper_id
- 使用每个管道将这些信息发送到缓冲区
- 缓冲区输出应该是:
member_id
,最高支付排序superGrouper
,最高支付排序grouperId
,最高支付diagnosis_id
,以及它们的描述......
请帮我创建一个缓冲区。提前致谢