我必须使用大量数据的聚类算法执行 map reduce 操作。我选择 MongoDB 是因为它的可扩展性、出色的文档、BSon 文档存储和许多其他出色的功能。
但是,map-reduce 操作太慢了。我的四核 CPU 只使用了一个核心。
我阅读了这份文档,我明白这是 JavaScript 的错。
“mongod 进程中一次只有一个线程执行 Javascript”
我该如何改进呢?提高 IO 速度?
- SSD存储可能有用吗?
- 将整个 MongoDB 的数据加载到 RAM 上?
否则瓶颈只有CPU 和单线程算法,所以我必须在 Mongo 之外用另一种语言重写我的算法,以利用多线程和多处理?