5

我正在构建一个利用 ZeroMQ N-to-N pub/sub 模型的 POC。在我们的应用服务器中,当一个 http 请求得到服务时,如果线程从数据库中提取数据,它会使用该数据更新一个本地 memcache 实例。为了同步应用服务器集群中的其他 memcache 实例,请求线程使用 ZMQ 发布者发送带有数据的消息......所以问题是:在应用程序时,在最小化套接字创建/销毁开销方面,什么策略最有效有很多线程依赖于套接字来发送消息?我们是否共享一个套接字池,我们是否为每个线程创建/销毁套接字等?

策略 1 - 线程管理的发布者套接字
在这种方法中,每个线程、T1T2T3,通过创建套接字对象(发布者)、建立连接、发送消息和最后关闭套接字来管理套接字对象(发布者)的生命周期。基于,这当然是最安全的方法,但我们担心重复创建、连接和销毁套接字时的开销;如果开销对性能产生负面影响,我们希望避免它。

在此处输入图像描述

策略 2 - 发布者套接字对象池
在这种方法中,父进程(应用服务器)在启动时初始化 ZMQ 发布者池。当一个线程需要一个发布者时,它从对象池中获取一个,发送它的消息,然后将发布者返回到池中;相对于使用发布者的线程而言,创建、连接和销毁套接字的过程被消除了,但是对池的访问是同步的,以避免任何两个线程同时使用同一个发布者对象,这就是死锁和并发问题的地方可能出现。

我们没有描述这两种方法,因为想先对 SO 测试做一个试金石。就数量而言,我们的应用程序不会发布“大量”消息,但可能同时有 100-150 个线程(每个应用服务器)需要发布消息。

ZMQ 发布者对象池

所以,重申一下:当应用程序有许多依赖于发布者发送消息的线程时,什么策略在最小化开销同时强调性能方面最有效?

4

2 回答 2

4

如果不提供估计吞吐量的真实数据,您就无法真正提出有关性能的问题。我们是在谈论每秒 10 个请求、100、1,000、10K 吗?

如果 HTTP 服务器确实为每个请求创建和销毁线程,那么重复创建 0MQ 套接字会给操作系统带来压力,并且取决于请求的数量和您的进程限制,它会起作用,或者它会耗尽句柄。您可以简单地对此进行测试,这是第一步。

然后,共享一个套接字池(您所说的“ZMQ 发布者”)是令人讨厌的。人们会这样做,但套接字不是线程安全的,因此这意味着当您将套接字切换到另一个线程时要非常小心。

如果有办法让线程保持持久性,那么每个线程都可以在需要时创建其 PUB 套接字,并在它存在时一直保留它。如果不是,那么我的第一个设计无论如何都会创建/销毁套接字,但使用 inproc:// 将消息发送到单个永久转发线程(SUB-PUB 代理)。我会对此进行测试,然后如果它坏了,那就去寻找更奇特的设计。

一般来说,最好做出最简单的设计并打破它,而不是过度思考设计过程(尤其是在开始时)。

于 2013-05-21T06:29:58.730 回答
1

对我来说,这听起来也像是过早的优化,如果可能的话,你应该坚持第一个策略,避免让自己头疼。

但作为第二个选项的替代方案,您也许可以在应用程序中维护一个 Executor 线程池来执行实际的 zmq 发送。这样每个执行器线程都可以保留自己的套接字。您可以监听应用程序/servlet 生命周期事件以了解何时关闭池和清理套接字。

编辑:

最简单的方法是Executors.newFixedThreadPool()使用使用 ThreadLocal 套接字的 Runnable 作业创建 Executor 并将其提供给它。(参见Java Executors and per-thread (not per-work unit) o​​bjects?)线程只会被创建一次并从那时起重复使用,直到 Executor 关闭。

run()当作业的方法中抛出异常时,这会变得有点棘手。我怀疑您会发现您需要对执行程序线程的生命周期进行更多控制。如果是这样,您可以复制源代码newFixedThreadPool

return new ThreadPoolExecutor(nThreads, nThreads,
                              0L, TimeUnit.MILLISECONDS,
                              new LinkedBlockingQueue<Runnable>());

并将ThreadPoolExecutor被实例化的子类化以自定义它。例如,您可以通过这种方式覆盖afterExecute以检测和清理损坏的套接字。

发送作业通过阻塞队列传输到工作线程。我意识到这不是 ZeroMQ 将消息传递给工作线程的方式,这将是 inproc 消息传递。这使 ZeroMQ 远离生命周期不受您控制的 HTTP 工作线程,因此难以维护套接字,更靠近应用程序的边缘。您必须简单地测试两者中哪一个更有效,并且必须对您希望应用程序采用 ZeroMQ 消息传递范式进行线程间通信的严格程度做出判断。

于 2013-05-21T06:58:36.130 回答