在编写 MapReduce 作业(特别是 Hadoop,如果相关)时,必须定义一个map()
和一个reduce()
函数,两者都产生一系列键/值对。键和值的数据类型由应用程序自由定义。
在单词计数的规范示例中,这两个函数都会产生类型对(string, int)
,键是单词,值是出现次数。在这里 - 以及在我看到的所有其他示例中 - 输出的键和值类型在两个函数之间是一致的。
必须/应该在MapReduce 的任何应用程序中产生的键/值对的类型相同map()
吗?reduce()
如果是:为什么?