40

每当我使用 'ab' 对 Web 服务器进行基准测试时,它会在发送大量请求后冻结一段时间,仅在 20 秒左右后继续。

考虑以下用 Ruby 编写的 HTTP 服务器模拟器:

require 'socket'

RESPONSE = "HTTP/1.1 200 OK\r\n" +
           "Connection: close\r\n" +
           "\r\n" +
           "\r\n"

buffer = ""
server = TCPServer.new("127.0.0.1", 3000)  # Create TCP server at port 3000.
server.listen(1024)                        # Set backlog to 1024.
while true
    client = server.accept             # Accept new client.
    client.write(RESPONSE)             # Write a stock "HTTP" response.
    client.close_write                 # Shutdown write part of the socket.
    client.read(nil, buffer)           # Read all data from the socket.  
    client.close                       # Close it.
end

然后我运行 ab 如下:

ab -n 45000 -c 10 http://127.0.0.1:3000/

在最初的几秒钟内,ab 完成了它应该做的工作并使用了 100% 的 CPU:

Benchmarking 127.0.0.1 (be patient)
Completed 4500 requests
Completed 9000 requests
Completed 13500 requests

在大约 13500 个请求之后,系统 CPU 使用率下降到 0%。ab 似乎被什么东西冻结了。问题不在服务器上,因为此时服务器正在调用accept()。大约 20 秒后,ab 继续,好像什么都没发生一样,并且将再次使用 100% CPU,只是在几秒钟后再次冻结。

我怀疑内核中的某些东西正在限制连接,但是什么以及为什么?我正在使用 OS X Leopard。我在 Linux 上也看到过类似的行为,尽管冻结发生在更多请求的情况下,并且不会经常发生。

这个问题使我无法运行大型 HTTP 基准测试。

4

3 回答 3

55

听起来您的临时端口用完了。要检查,请使用该命令并在该状态下netstat查找数千个端口。TIME_WAIT

在 Mac OS X 上,默认的临时端口范围是 49152 到 65535,总共 16384 个端口。您可以使用以下sysctl命令进行检查:

$ sysctl net.inet.ip.portrange.first net.inet.ip.portrange.last
net.inet.ip.portrange.first: 49152
net.inet.ip.portrange.last: 65535

一旦你用完了临时端口,你通常需要等到TIME_WAIT状态过期(2 * 最大段生命周期),直到你可以重用特定的端口号。您可以通过将范围更改为从 32768 开始来使端口数量翻倍,这是 Linux 和 Solaris 上的默认值。(最大端口号为 65535,因此不能增加高端。)

$ sudo sysctl -w net.inet.ip.portrange.first=32768
net.inet.ip.portrange.first: 49152 -> 32768

请注意,IANA 指定的官方范围是 49152 到 65535,一些防火墙可能会假定动态分配的端口属于该范围。您可能需要重新配置防火墙才能使用本地网络之外的更大范围。

也可以减少最大段生命周期(sysctl net.inet.tcp.msl在 Mac OS X 上),它控制TIME_WAIT状态的持续时间,但这很危险,因为它可能导致旧连接与使用相同端口号的新连接混淆。还有一些技巧涉及使用选项绑定到特定端口SO_REUSEADDR或使用选项关闭SO_LINGER,但这些技巧也可能导致新旧连接混淆,因此通常被认为是坏主意。

于 2009-08-01T17:42:09.717 回答
26

TIME_WAIT在 Mac OS X 上更改端口的长度,而不是增加端口的数量。

这仅在开发中有效,但我现在可以ab根据需要请求尽可能多的请求而不会超时。

将默认超时设置为 1000 毫秒,如下所示:

$ sudo sysctl -w net.inet.tcp.msl=1000
net.inet.tcp.msl: 15000 -> 1000

另一个答案中提到的 brianp.net 页面不再可用。您可以从Internet 存档中检索它。

于 2011-07-14T19:51:09.060 回答
1

解决此问题的另一个选项是通过添加"-k"选项来启用 HTTP KeepAlive。这将使 ab 重新使用 TCP 连接,因此它不会耗尽所有可用端口。例如:

ab -n 45000 -c 10 -k http://127.0.0.1:3000/

于 2019-04-20T20:32:31.933 回答