最有可能的是,只需将所有工作委托给一个水平缩放的队列,单个读者就足够了。
如果事实证明这还不够,并且您的阅读器仍然需要水平扩展,那么您可以通过使用匹配过滤器来实现这一点,它允许多个阅读器划分工作。
例如,如果您有一个带有十六进制字符的 id,您可以通过在每个服务器上使用匹配运算符将工作拆分到两个服务器上,其中每个服务器匹配全范围内的一半字符:
// Change Stream Reader 1
const params = [
{ $match: { _id: /^[0-7]/ } }
];
const collection = db.collection('inventory');
const changeStream = collection.watch(params);
在第二台机器上:
// Change Stream Reader 2
const params = [
{ $match: { _id: /^[8-9a-f]/ } }
];
const collection = db.collection('inventory');
const changeStream = collection.watch(params);
如果您需要超过 16 台服务器,则可以使范围更加具体:
// Server 0 matches on /^0[0-7]/
// Server 1 matches on /^1/
// ...
// Server 15 matches on /^f/
// Server 16 matches on /^0[8-9a-f]/
这将允许每台机器观看消息子集并处理它们,而其他机器正在处理其他消息而不会重复。
协调哪个服务器以稳健的方式监视哪个范围变得有些复杂,因为您需要确保崩溃或挂起的机器恢复,如果您需要动态水平扩展,那么您需要能够向服务器提供新范围并调整大小. 此解决方案还会导致消息被乱序处理,因此如果顺序很重要,那么您需要想出一个解决方案来重新排序消息或处理乱序问题。
但这些都是与这个问题不同的主题,所以我现在将省略细节。