您能否解释一下已在各种 servlet 实现中实现的两种方法:
- 每个连接的线程
- 每个请求的线程
上述两种策略中哪一种更适合扩展,为什么?
您能否解释一下已在各种 servlet 实现中实现的两种方法:
上述两种策略中哪一种更适合扩展,为什么?
上述两种策略中哪一种更适合扩展,为什么?
每个请求的线程比每个连接的线程更好地扩展。
Java 线程相当昂贵,通常每个使用 1Mb 内存段,无论它们是活动的还是空闲的。如果您为每个连接提供自己的线程,则该线程通常会在连接上的连续请求之间处于空闲状态。最终,框架需要停止接受新连接(因为它不能创建更多线程)或开始断开旧连接(如果/当用户醒来时,这会导致连接流失)。
HTTP 连接所需的资源比线程堆栈要少得多,尽管由于 TCP/IP 的工作方式,每个 IP 地址有 64K 个打开连接的限制。
相比之下,在每请求线程模型中,线程仅在处理请求时关联。这通常意味着服务需要更少的线程来处理相同数量的用户。而且由于线程使用大量资源,这意味着服务将更具可扩展性。
(请注意,每个请求的线程并不意味着框架必须关闭 HTTP 请求之间的 TCP 连接......)
话虽如此,当每个请求的处理过程中存在长时间的停顿时,每个请求的线程模型并不理想。(而且当服务使用涉及长时间保持回复流打开的彗星方法时尤其不理想。)为了支持这一点,Servlet 3.0 规范提供了一种“异步 servlet”机制,它允许 servlet 的请求方法挂起它与当前请求线程的关联。这释放线程去处理另一个请求。
如果 Web 应用程序可以设计为使用“异步”机制,那么它可能比每请求线程或每连接线程更具可扩展性。
跟进
让我们假设一个包含 1000 张图片的网页。这会产生 1001 个 HTTP 请求。进一步让我们假设使用了 HTTP 持久连接。使用 TPR 策略,这将导致 1001 个线程池管理操作 (TPMO)。使用 TPC 策略,这将产生 1 个 TPMO……现在,根据单个 TPMO 的实际成本,我可以想象 TPC 可能比 TPR 更好地扩展的场景。
我认为有些事情你没有考虑过:
Web 浏览器面临要获取大量 URL 以完成一个页面,很可能会打开多个连接。
使用 TPC 和持久连接,线程必须等待客户端接收响应并发送下一个请求。如果网络延迟很高,则此等待时间可能很长。
服务器无法知道何时可以关闭给定(持久)连接。如果浏览器不关闭它,它可能会“徘徊”,束缚 TPC 线程,直到服务器超时连接。
TPMO 开销并不大,尤其是当您将池开销与上下文切换开销分开时。(您需要这样做,因为 TPC 会在持久连接上引发上下文切换;见上文。)
我的感觉是,这些因素可能会超过每个连接专用一个线程所节省的 TPMO。
HTTP 1.1
- 支持持久连接,这意味着可以使用相同的 HTTP 连接接收/发送多个请求/响应。因此,要并行运行使用相同连接接收到的那些请求,Thread
会为每个请求创建一个新请求。
HTTP 1.0
- 在这个版本中,使用连接只收到一个请求,并且在发送响应后连接被关闭。所以只为一个连接创建了一个线程。
Thread per connection
HTTP Connection
是从multiple requests
(keep-alive)重用相同的概念。
Thread per request
each request
将从.Server创建一个线程,client
可以创建多个threads
as per request
。
每个请求的线程将为服务器接收的每个 HTTP 请求创建一个线程。
每个连接的线程将重用来自多个请求的相同 HTTP 连接(保持活动)。AKA HTTP 持久连接
但请注意,这仅支持HTTP 1.1
每个请求的线程更快,因为大多数 Web 容器使用线程池。
您应该在服务器上的核心数上设置的最大并行连接数。更多内核 => 更多并行线程。
请参阅此处如何配置... Tomcat 6:http: //tomcat.apache.org/tomcat-6.0-doc/config/executor.html
Tomcat 7:http: //tomcat.apache.org/tomcat-7.0-doc/config/executor.html
例子
每个请求的线程应该更好,因为它重用线程,而某些客户端可能处于空闲状态。如果您有很多并发用户,则可以使用较少数量的线程为他们提供服务,并且具有相同数量的线程会更昂贵。还有一个考虑因素——我们不知道用户是否仍在使用应用程序,所以我们不知道何时销毁线程。对于每个请求一个线程机制,我们只使用一个线程池。