java - ZeroMQ 多线程：按需创建套接字还是使用套接字对象池？

Question

我正在构建一个利用 ZeroMQ N-to-N pub/sub 模型的 POC。在我们的应用服务器中，当一个 http 请求得到服务时，如果线程从数据库中提取数据，它会使用该数据更新一个本地 memcache 实例。为了同步应用服务器集群中的其他 memcache 实例，请求线程使用 ZMQ 发布者发送带有数据的消息......所以问题是：在应用程序时，在最小化套接字创建/销毁开销方面，什么策略最有效有很多线程依赖于套接字来发送消息？我们是否共享一个套接字池，我们是否为每个线程创建/销毁套接字等？

策略 1 - 线程管理的发布者套接字
在这种方法中，每个线程、T1、T2和T3，通过创建套接字对象（发布者）、建立连接、发送消息和最后关闭套接字来管理套接字对象（发布者）的生命周期。基于此，这当然是最安全的方法，但我们担心重复创建、连接和销毁套接字时的开销；如果开销对性能产生负面影响，我们希望避免它。

在此处输入图像描述

策略 2 - 发布者套接字对象池
在这种方法中，父进程（应用服务器）在启动时初始化 ZMQ 发布者池。当一个线程需要一个发布者时，它从对象池中获取一个，发送它的消息，然后将发布者返回到池中；相对于使用发布者的线程而言，创建、连接和销毁套接字的过程被消除了，但是对池的访问是同步的，以避免任何两个线程同时使用同一个发布者对象，这就是死锁和并发问题的地方可能出现。

我们没有描述这两种方法，因为想先对 SO 测试做一个试金石。就数量而言，我们的应用程序不会发布“大量”消息，但可能同时有 100-150 个线程（每个应用服务器）需要发布消息。

ZMQ 发布者对象池

所以，重申一下：当应用程序有许多依赖于发布者发送消息的线程时，什么策略在最小化开销同时强调性能方面最有效？

score 4 · Accepted Answer

如果不提供估计吞吐量的真实数据，您就无法真正提出有关性能的问题。我们是在谈论每秒 10 个请求、100、1,000、10K 吗？

如果 HTTP 服务器确实为每个请求创建和销毁线程，那么重复创建 0MQ 套接字会给操作系统带来压力，并且取决于请求的数量和您的进程限制，它会起作用，或者它会耗尽句柄。您可以简单地对此进行测试，这是第一步。

然后，共享一个套接字池（您所说的“ZMQ 发布者”）是令人讨厌的。人们会这样做，但套接字不是线程安全的，因此这意味着当您将套接字切换到另一个线程时要非常小心。

如果有办法让线程保持持久性，那么每个线程都可以在需要时创建其 PUB 套接字，并在它存在时一直保留它。如果不是，那么我的第一个设计无论如何都会创建/销毁套接字，但使用 inproc:// 将消息发送到单个永久转发线程（SUB-PUB 代理）。我会对此进行测试，然后如果它坏了，那就去寻找更奇特的设计。

一般来说，最好做出最简单的设计并打破它，而不是过度思考设计过程（尤其是在开始时）。

score 1 · Accepted Answer

对我来说，这听起来也像是过早的优化，如果可能的话，你应该坚持第一个策略，避免让自己头疼。

但作为第二个选项的替代方案，您也许可以在应用程序中维护一个 Executor 线程池来执行实际的 zmq 发送。这样每个执行器线程都可以保留自己的套接字。您可以监听应用程序/servlet 生命周期事件以了解何时关闭池和清理套接字。

编辑：

最简单的方法是Executors.newFixedThreadPool()使用使用 ThreadLocal 套接字的 Runnable 作业创建 Executor 并将其提供给它。（参见Java Executors and per-thread (not per-work unit) objects？）线程只会被创建一次并从那时起重复使用，直到 Executor 关闭。

run()当作业的方法中抛出异常时，这会变得有点棘手。我怀疑您会发现您需要对执行程序线程的生命周期进行更多控制。如果是这样，您可以复制源代码newFixedThreadPool：

return new ThreadPoolExecutor(nThreads, nThreads,
                              0L, TimeUnit.MILLISECONDS,
                              new LinkedBlockingQueue<Runnable>());

并将ThreadPoolExecutor被实例化的子类化以自定义它。例如，您可以通过这种方式覆盖afterExecute以检测和清理损坏的套接字。

发送作业通过阻塞队列传输到工作线程。我意识到这不是 ZeroMQ 将消息传递给工作线程的方式，这将是 inproc 消息传递。这使 ZeroMQ 远离生命周期不受您控制的 HTTP 工作线程，因此难以维护套接字，更靠近应用程序的边缘。您必须简单地测试两者中哪一个更有效，并且必须对您希望应用程序采用 ZeroMQ 消息传递范式进行线程间通信的严格程度做出判断。

java - ZeroMQ 多线程：按需创建套接字还是使用套接字对象池？

2 回答 2

Related

Reference