6

我知道这是一个经常出现的问题,并且我读过类似以下http://www.mailinator.com/tymaPaulMultithreaded.pdf的文章,说 nio 的扩展性比 io 好不一定是真的。

但是我很难看到在开发 Web 服务器时 java nio 如何比传统的接受器/工作线程架构更好地扩展?让我解释:

通常 Java Web 服务器使用以下模式来处理连接:

  • 一些接受器线程受限于 ServerSocket 的 accept() 方法上的核心块数:

    while (true) {
      socket = serverSocket.accept();
      // handleRequest submits the socket to a queue
      handleRequest(socket);
      socket.close();
    }
    
  • 当客户端套接字被检索到时,它被提交到一个非阻塞队列,然后由工作线程池中的工作线程处理。工作线程的数量取决于正在执行的 io 操作的持续时间。

使用 java.nio 如何使该架构更具可扩展性?

我的意思是我仍然需要有工作线程来处理执行阻塞操作的请求(访问数据库或文件系统,调用外部服务)。如果后端操作不像 node.js 那样异步执行,我仍然需要工作线程来限制整体可伸缩性与 1 或 2 个事件调度程序线程。

4

2 回答 2

18

我真的很喜欢 Paul Tyma 关于这个问题的文章,它真的很深入。我会在他的文章中看到两个要点:

  • 您可以使用传统的阻塞 IO 获得更好的吞吐量(他测量过)
  • 传统的阻塞 IO 使您的服务器逻辑方式不那么复杂——客户端-服务器对话的状态在线程流中隐式定义。

使用非阻塞 NIO 的主要原因是当您有许多同时的空闲请求时。这样做的原因是:使用 NIO,您可以从同一个线程处理多个请求,这更好

好的,这是您可以在任何地方阅读的内容。现在......为什么更好

有两个主要原因,它们与每个线程带来的两种不同类型的开销有关:

  • 当调度程序更改处理器正在执行的线程时,会有一个“上下文切换”,这可能是一项昂贵的操作(即,线程在处理器中具有某种状态——寄存器中的值,L1、L2 中加载的大量数据, L3 缓存等 - 当线程停止时必须“保存”在某处,当线程继续执行时“重新加载”;此外,当您丢失 L1、L2、L3 缓存的内容时,您可能会得到大量缓存未命中,这可能是坏的(或不是,取决于工作负载))
  • 每个线程必须分配自己的独立堆栈(通常用于存储局部变量和函数调用的返回地址)

因此,每个线程都带有更多“浪费”的内存和可能“浪费”的处理器周期(以执行“上下文切换”)。

现在,假设您有一个聊天服务器,客户端建立 HTTP 连接以请求新消息,并且您的服务器仅在该客户端有新消息时才会回复它们(以便客户端立即接收新消息)。假设您有 10k 个这样的客户。在传统的、阻塞的、每个连接线程的模型中,您将拥有 10k 个线程。在 Java 中,线程堆栈大小 (-Xss) 的典型标准值为 256kb。使用 10k 线程,您将自动使用大约 2GB 内存!!!!!!!!!更糟糕的是:即使您的聊天服务器上没有任何活动,也没有发送消息,客户端仍然让您浪费这 2GB。添加大量的上下文切换,你会发现你有问题。

在这种情况下,您最好使用非阻塞 NIO,其中更少的线程(最终只有 1 个!)足以处理所有 10k 客户端,因此您可以节省上下文切换(即 cpu 时间)和线程堆栈(即内存),甚至以更复杂的代码为代价,这通常是使用非阻塞 NIO 的副作用。

于 2013-04-12T05:26:47.827 回答
3

NIO 或者非阻塞 IO 可以很好的扩展高并发,你不需要每个连接都有一个专用线程,你只需要一个主线程来接受连接并有几个其他工作线程来处理 IO,线程数是固定的,这是它比传统的接受器/工作线程架构更具可扩展性的主要原因。

于 2013-04-12T05:12:54.847 回答