输入
1 - - GET hm_brdr.gif
2 - - GET s102382.gif ( "1", {"- - GET hm_brdr.gif"})
3 - - GET bg_stars.gif map-reduce-> ( "2", {"- - GET s102382.gif"})
3 - - GET phrase.gif ( "3", {"- - GET bg_stars.gif,"- - GET phrase.gif"})
我想使用随机整数将第一列值设为 1,2,3.. 匿名。但它不应该像一行中的 1->x 和另一行中的 1->t 那样改变它。所以我的解决方案是在 reduce 步骤中用随机整数 (rand(1)=x, rand(2)=y ..) 替换“键”,并用它们的新键取消组合值并再次写入文件,如下所示.
输出文件
x - - GET hm_brdr.gif
y - - GET s102382.gif
z - - GET bg_stars.gif
z - - GET phrase.gif
我的问题是,在运行时间方面有没有更好的方法来做到这一点?