8

虽然这个问题被标记为 EventMachine,但任何语言的通用 BSD-socket 解决方案也非常受欢迎。


一些背景:

我有一个监听 TCP 套接字的应用程序。它使用常规的 System V 风格的初始化脚本启动和关闭。

我的问题是它需要一些时间才能准备好为 TCP 套接字提供服务。这不是太长,也许只有 5 秒,但在工作日需要重新启动时,这 5 秒太长了。现有连接保持打开并正常完成也很重要。

重新启动应用程序的原因是补丁、升级等。不幸的是,我发现自己每隔一段时间就需要在生产中做这种事情。


问题:

我正在寻找一种方法来巧妙地将 TCP 侦听套接字从一个进程切换到另一个进程,因此只能获得一瞬间的停机时间。我希望现有的连接/套接字保持打开并在旧进程中完成处理,而新进程开始为新的连接提供服务。

是否有一些使用 BSD 套接字的行之有效的方法?(EventMachine 解决方案的奖励积分。)

是否有开源库可以实现这一点,我可以按原样使用或用作参考?(同样,非 Ruby 和非 EventMachine 解决方案也很受欢迎!)

4

2 回答 2

8

有几种方法可以在不停机的情况下做到这一点,并对服务器程序进行适当的修改。

一种是在服务器本身中实现重新启动功能,例如在接收到某个信号或其他消息时。然后程序将执行它的新版本,将监听套接字的文件描述符号作为参数传递给它。此套接字将FD_CLOEXEC清除标志(默认),以便继承它。由于其他套接字将继续由原始进程提供服务,并且不应传递给新进程,因此应在那些使用fcntl(). 在 fork 并执行新进程之后,原始进程可以继续并关闭侦听套接字,而不会中断服务,因为新进程现在正在侦听该套接字。

另一种方法是,如果您不希望旧服务器必须派生并执行新服务器本身,则可以使用Unix 域套接字在新旧服务器进程之间进行通信。一个新的服务器进程在启动时可以在文件系统中一个众所周知的位置检查这样的套接字。如果存在,新服务器将连接到此套接字并请求旧服务器使用 SCM_RIGHTS 将其侦听套接字作为辅助数据传输。cmsg(3)的末尾给出了一个例子。

于 2010-02-05T16:57:17.240 回答
1

Jean-Paul Calderone 在 2004 年写了一篇详细的演示文稿,介绍了使用 Twisted 解决您的问题的整体解决方案,包括套接字迁移和其他问题。

于 2010-05-29T14:03:01.163 回答