我不是 mongodb 专家,所以我现在对服务器设置有点不确定。
我有一个使用wiredtiger 运行mongo3.0.2 的单个实例,接受读写操作。它从客户端收集日志,因此写入负载不错。每天一次我想处理这些日志并使用聚合框架计算一些指标,要处理的数据集类似于上个月的所有日志,所有计算大约需要 5-6 小时。我正在考虑拆分写入和读取以避免锁定我的集合(服务器在我阅读时继续写入日志,新写入的日志可能与我的查询匹配,但我可以跳过它们,因为我不需要 100% 的准确度)。
换句话说,我想使用辅助读取进行设置,其中复制不是连续执行,而是在配置的时间开始,或者在所有读取操作开始之前触发更好。
我正在从 node.js 进行所有处理,所以我在这里看到的一个选项是导出在某个时期(例如 [昨天,今天])创建的数据,然后将其导入到我自己读取实例并在导入完成后进行计算。我正在寻找副本集和主/从复制作为可能的设置,但我没有得到如何配置它来实现所描述的场景。所以也许我错了,错过了什么?还有其他选择可以实现这一目标吗?