7

我正在设计一个系统,其中有一个主要的对象流,并且有多个从该对象产生一些结果的工作人员。最后,有一些特殊/独特的工作人员(就图论而言,有点像“接收器”),它获取所有结果,并将它们处理为写入某个数据库的最终对象。

一个工人可能依赖于其他一些工人的结果(因此,等待他们的结果)

现在,我面临几个问题:

  1. 可能是一名工人比另一名工人慢得多。你怎么处理那件事呢?添加更多较慢类型的工人(=缩放)?(也许是动态的)
  2. 假设 W_B 依赖于 W_A。如果 W_B 由于某种原因关闭,则流程将停止,系统将停止工作。所以我希望系统以某种方式绕过这个工人。
  3. 此外,最终工作人员如何决定何时对结果集进行操作?假设它有 A 和 B 的结果,但缺少 C 的结果。可能是 C 已关闭,或者目前非常慢。它如何做出决定?

值得一提的是,它不是一个实时应用程序,而是一个离线处理系统(即您可以访问数据库并更改记录),但同时它必须以“高速度”处理相对大量的对象”。

关于技术,
我正在使用 Java 开发系统,但我不受特定技术的限制。

如果您能帮助我进行系统的总体设计,我会很高兴。

非常感谢!

4

2 回答 2

4

正如彼得所说,这实际上取决于用例。一些一般性的评论:

  1. 如果一个工人比另一个慢,可能会创建更多该类型的实例;例如,Kubernetes 允许动态节点创建,而 Kafka 允许对主题进行分区,以便多个实例可以读取和处理它。

  2. 如果 B 依赖于 A 而 A 宕机了,B 就无法工作,仅此而已。也许重新启动A?也许您可以对其进行定期健康检查。

  3. 如果最终worker需要A、B和C的结果,如果C不可用,它将如何处理?如果可以,它可以存储 A 和 B 的结果,安装一个计时器,如果在 C 没有到达的情况下它就停止了,继续。

于 2018-11-22T08:33:21.723 回答
3

一些额外的想法:

  1. 如果您的意思是说整个应用程序的某些子任务比其他子任务执行得更快,那么最好将应用程序切分,以便每个工作人员都做一些事情 - 换句话说,分享快速工作和缓慢工作的一部分。但是如果你的意思是说有些机器比其他机器慢,那么你可以在慢机器上运行更少的工人,在速度更快的机器上运行更多的工人,以平衡事情,让每个工人拥有大致相同的资源。

  2. 您可能希望通过工作人员之间的某种持久排队来解耦您的架构。

  3. 使用带有超时和重启的心跳是很常见的。

分布式流处理很快变得非常复杂。如果您在顶部构建一个提供高可用性和开箱即用的一次性语义的流处理框架,您的生活将会轻松得多。

于 2018-11-24T10:18:53.950 回答