我正在使用具有 4 个 MapReduce 步骤的程序。我的第一步的输出是:
id value
1 20
2 3
3 9
4 36
我有大约 1,000,000 个 ID,在第二步中我必须对值进行排序。这一步的输出:
id value
4 36
1 20
3 9
2 3
如何在 map reduce 中对数据进行排序?我需要使用 terasort 吗?如果是,我如何在程序的第二步中使用 terasort?谢谢。