0

根据本文本文,显然 MapReduce 查询是在 MongoDB 中可以做的最慢的事情之一。

  1. 如果数据集很大,那么执行 MapReduce 而不是将整个数据集发送到客户端并在那里进行处理不是更好吗?

  2. MapReduce 查询是否会锁定数据库并因此阻止它响应其他请求?

  3. 我发现 MapReduce 非常合乎逻辑且易于理解,而 2.1 版中的聚合框架似乎有点压倒性!这是 MongoDB 对没有高性能 MapReduce 设施的回应,因此建议完全放弃 MapReduce?

4

1 回答 1

1
  1. 取决于您对“大”的定义,但我仍然会选择运行 map-reduce(在辅助服务器上,这样主服务器不会被阻塞)

  2. Map-reduce 作业需要大量的短期锁。

    2.1。他们在读取数据时获取读取锁,这不会阻塞任何东西。

    2.2. 他们在写入数据(临时或最终集合)时使用写锁。这会阻止其他操作。

    2.3. 他们在需要执行 javascript 时使用 JS 锁。他们一直在执行,因为 map 和 reduce 函数在 javascript 中。这是 map 阶段的一个典型序列:“获取读锁,从输入集合中获取文档,释放读锁,获取 js 锁,将 map 函数应用于该文档,释放 js 锁,获取写锁,将条目写入临时集合,释放写锁”。

  3. 是的,map-reduce 的基本思想很简单。但我发现聚合管道很简单。也许更简单。“获取此数据,对其应用此转换数组,我将获取结果”。还有什么比这更简单的?

于 2012-06-26T04:45:59.647 回答