如果我在 Mongo DB 上有 100 万条记录,并且每条记录有 5 KB 大。假设我想对这些数据运行 Map-Reduce,并想估计这个应用程序所需的 RAM。在 map-reduce 操作期间,不会对该数据库进行读取或写入。map-reduce 将聚合一些记录并对聚合记录进行逻辑比较。
我想了解 map-reduce 如何将数据带入 RAM 以及如何计算工作集(例如:我是否应该假设 1 MM x 5 Kb 将是我的工作集)。
如果我在 Mongo DB 上有 100 万条记录,并且每条记录有 5 KB 大。假设我想对这些数据运行 Map-Reduce,并想估计这个应用程序所需的 RAM。在 map-reduce 操作期间,不会对该数据库进行读取或写入。map-reduce 将聚合一些记录并对聚合记录进行逻辑比较。
我想了解 map-reduce 如何将数据带入 RAM 以及如何计算工作集(例如:我是否应该假设 1 MM x 5 Kb 将是我的工作集)。