在网上,我看到很多规范字数图减少的例子。我理解 k,v => 的映射器输入以减少 k,list(v) 的输入。map reduce 带来了一些魔力。我不太明白如何将 mapreduce 应用于更实际的示例。例如:假设我有一个文件,其中包含美国所有员工的工资以及其他一些详细信息,例如州和城市等... mapreduce 如何工作以提供包含汇总的以下列的输出报告?州,城市,平均(工资)
在 SQL 中,我可以通过这样的查询得到它:
Select state, city, avg(salaries)
From employee_tbl
Group by state, city
map reduce 将如何为我提供上述结果集。我使用过 hive,但我不知道如何将 SQL 转换为 map 和 reduce。