我是hadoop的新手,我正在使用一个程序,map函数的输入是一个文件,键是这样的:
ID: value:
3 sd
37 g
5675 gk
68 oi
我的文件大约 10 GB,我想更改这些 ID 并按降序重新编号。我不想改变价值观。我的输出必须是这样的:
ID: value:
5675 sd
68 g
37 gk
3 oi
我想在节点集群中完成这项工作?我怎样才能做到这一点?
我认为我需要一个全局变量,而我不能在集群中执行此操作?我能做些什么?