我一直在尝试了解 MongoDB 中 MapReduce 的基础知识,即使在实现它之后,我也不确定它与 SQL 的 GROUP BY 甚至是 Mongo 自己的 GROUP BY 有什么不同。在 SQL Server 中,GROUP BY 可以通过流或散列聚合来完成。MapReduce 是不是类似于散列聚合,只是在大量服务器之上?
我一直在阅读 MR for MongoDB 将作为后台进程运行的地方,因为它是一个“繁重的操作”。鉴于数据是分片的,GROUP BY 不是同样“重”吗?也就是说,我只是想比较那些可以作为 MR 作业或使用 GROUP BY 查询来实现的操作类型。
有没有 GROUP BY 不能做,只有 MR 能做的事情?
此外,Hadoop 似乎非常擅长 MR(这只是我读过的……我从未在 Hadoop 上工作过)。Hadoop 的 MR 与 Mongo 的 MR 有何不同?
我很困惑。请帮助或指导我找到一个解释 MapReduce 需求的好教程。