我正在运行一个相当大规模的 Node.js 0.8.8 应用程序,它使用具有 16 个工作进程的集群,在具有超线程的 16 处理器机器上(所以 32 个逻辑核心)。我们发现,自从迁移到 Linux 3.2.0 内核(从 2.6.32 开始)后,工作子进程之间传入请求的平衡似乎被重压到 5 个左右的进程,而其他 11 个根本没有做太多工作。这可能对吞吐量更有效,但似乎增加了请求延迟,对我们来说并不是最优的,因为其中许多是可以同时开始工作的长期 websocket 连接。
子进程都在套接字上接受(使用 epoll),虽然这个问题在 Node 0.9 中有一个修复(https://github.com/bnoordhuis/libuv/commit/be2a2176ce25d6a4190b10acd1de9fd53f7a6275),但该修复似乎没有帮助我们的测试。是否有人知道内核调整参数或构建选项可能会有所帮助,或者我们是否最好回到 2.6 内核或使用不同的方法跨工作进程进行负载平衡?
我们将其归结为一个简单的 HTTP Siege 测试,但请注意,这是在具有超线程(即 24 个逻辑内核)的 12 核机器上运行 12 个 proc,并且在套接字上接受 12 个工作进程,而不是我们的 16 个生产中的过程。
HTTP Siege 在 Debian Squeeze 上使用 Node 0.9.3,在裸机上使用 2.6.32 内核:
reqs pid
146 2818
139 2820
211 2821
306 2823
129 2825
166 2827
138 2829
134 2831
227 2833
134 2835
129 2837
138 2838
除了 3.2.0 内核之外的所有内容都相同:
reqs pid
99 3207
186 3209
42 3210
131 3212
34 3214
53 3216
39 3218
54 3220
33 3222
931 3224
345 3226
312 3228