7

我正在使用(PostgreSQL)9.2.1 并使用 pgbench 测试数据库。

pgbench -h 192.168.39.38 -p 5433 -t 1000 -c 40 -j 8 -C -U admin testdb

当我使用 -C 参数(为每个事务建立一个新连接)时,事务总是在第 16381 个事务之后丢失。

Connection to database "testdb" failed
could not connect to server: Can't assign requested address
    Is the server running on host "192.168.39.38" and accepting
    TCP/IP connections on port 5433?
Client 19 aborted in establishing connection.
Connection to database "testdb" failed
could not connect to server: Can't assign requested address
    Is the server running on host "192.168.39.38" and accepting
    TCP/IP connections on port 5433?
Client 19 aborted in establishing connection.
....

transaction type: TPC-B (sort of)
scaling factor: 30
query mode: simple
number of clients: 40
number of threads: 8
number of transactions per client: 1000
number of transactions actually processed: 16381/40000
tps = 1665.221801 (including connections establishing)
tps = 9487.779510 (excluding connections establishing)

并且每次测试实际处理的事务数始终为16381。但是,pgbench 可以成功,并且所有事务都在以下情况下处理

-C 未使用

或者

总交易量小于 16381

删除这些事务后,数据库可以在几秒钟内继续接受连接。我想知道我是否错过了 PostgreSQL 的一些配置。

谢谢


编辑我发现客户端被阻止连接几秒钟,但其他人仍然可以访问数据库。这是否意味着同一个客户端不能在短时间内发送太多交易?

4

4 回答 4

4

我找到了它在大约 16000 次交易后失去连接的原因。TCP wait_time 为这个错误负责。以下命令将显示 TCP 连接的状态:

$ netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

尽管如此,它并没有在 MAC OS X 中显示 TIME_WAIT。因此我错过了它。通过以下命令调整 TCP wait_time 后,pgbench 可以正常工作。

$ sudo sysctl -w net.inet.tcp.msl=1500
net.inet.tcp.msl: 15000 -> 1500

感谢您的帮助。

于 2012-11-30T03:25:59.067 回答
1

操作系统确实存在最大连接数限制。阅读文档中的最大连接数:(加粗的相关部分)

确定与数据库服务器的最大并发连接数。默认值通常为 100 个连接,但如果您的内核设置不支持它可能会更少(在 initdb 期间确定)。此参数只能在服务器启动时设置。

增加此参数可能会导致 PostgreSQL 请求的 System V 共享内存或信号量超过操作系统默认配置所允许的数量。如有必要,请参阅第 17.4.1 节了解有关如何调整这些参数的信息。

您只能打开 16381 个连接,可以通过 2^14 (=16384) 个可能的最大连接减去默认为超级用户连接保留的 3 个连接来解释(请参阅文档)。

于 2012-11-29T08:40:55.197 回答
0

有趣的是,16381 如此接近 2 的幂。

这主要是猜测:

我想知道这是否是操作系统的事情。查看 TPS 数据,是否为每笔交易创建了新的连接?[编辑是的,现在我正确阅读了您的问题。]

也许操作系统只有这么多它可以使用的连接资源,并且在最近建立了 16381(加上几个额外的)之后无法立即创建新连接?

可能存在用于指定可用连接资源数量的操作系统设置,这可能允许使用更多连接。您可以在问题中添加一些操作系统详细信息吗?


特别是我会怀疑您连接的端口号一直在增加并且您达到了限制。尝试“lsof -i”,看看你是否可以在发生连接时捕捉到连接,看看这个数字是否在上升。

于 2012-11-28T03:27:05.637 回答
0

我通过设置为 /etc/sysctl.conf 解决了问题:

net.ipv4.ip_local_port_range = 32768 65000
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 10
于 2015-08-24T09:54:22.223 回答