我有一个映射器,它给了我这样的话,
apple 10 12012013
apple 20 12022013
apple 30 12042013
apple 40 12032013
其中第一个值是单词,然后是该单词在第 3 列中提到的那一天的出现次数。
我写了一个减速器,它可以选择作为苹果的键,然后得到它的总数。
所以输出是这样的
apple 100
但我需要输出为,
100 apple 12012013:10 12022013:20 12032013:30 12042013:40
知道我应该如何修改我的映射器吗?
我在 Amazon EMR Hadoop Streaming 上运行这个 Map reduce 作业。
编辑:下面的代码完美运行,但我得到的输出为:
4 apple 20130601
:1 20130602
:1 20130601
:1 20130602
:1
任何想法 ?