0

我正在使用 ldirectord 来平衡两个 IIS 服务器。ldirectord.cg 如下所示:

autoreload = yes
quiescent = yes
checkinterval = 1
negotiatetimeout = 2
emailalertfreq = 60
emailalert = Konstantin.Boyanov@mysite.com
failurecount = 1

virtual = 172.22.9.100:80
    checktimeout = 1
    checktype = negotiate
    protocol = tcp
    real = 172.22.1.133:80 masq 2048
    real = 172.22.1.134:80 masq 2048
    request = "alive.htm"
    receive = "I am not a zombie"
    scheduler = wrr

负载平衡工作正常,真实服务器可见等。不过,我遇到了一个简单测试的问题:

  1. 我打开了一些从客户端浏览器(IE 8)到托管在真实服务器上的站点的连接
  2. 我将上述连接服务器的真实服务器的权重设置为 0,只让其他真实服务器保持活动状态
  3. 我重新加载页面以重新生成连接

我用 ipvsadm -Ln 看到的是连接仍在“死”服务器上。我必须等待一分钟(我想浏览器端有一些 TCP 超时)才能将它们传输到“活动”服务器。如果在这一分钟内我继续按下重新加载按钮,连接将停留在“死”服务器上,并且它们的 TCP 超时计数器会重新启动。

所以我的问题是:有没有办法告诉 NAT 模式下的负载均衡器立即(或接近立即)终止/重定向现有连接到死服务器?

在我看来,客户端上的重新加载会使连接变成“僵尸”是一个错误,例如,尽管不使用持久性并且其他服务器已准备好可用,但仍绑定到死的真实服务器。

我发现影响此超时的唯一一件事是更改运行我用于测试的 IE8 的 Windows 机器中的 keepAliveTimeout。当我将它从 60 秒的默认值更改为 30 秒时,连接可以在 30 秒后转移。在我看来,客户端设置会影响作为负载均衡器的网络组件的运行,这很奇怪。

还有一件事 - ipvsadm 输出中名为“Inactive Conenctions”的列是用来做什么的?哪些连接被认为是非活动的?

而且在 ipvsadm 的输出中,我看到了几个与状态 TIME_WAIT 的连接。这些是干什么用的?

任何见解和建议都非常感谢!

干杯,康斯坦丁

PS:以下是有关配置的更多信息:

# uname -a
Linux 3.0.58-0.6.2-default #1 SMP Fri Jan 25 08:31:01 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux

# ipvsadm -L
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
  -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
TCP  lb-mysite.com wrr
  -> spwfe001.mysite.com:h Masq    10     0          0
  -> spwfe002.mysite.com:h Masq    10     0          0

# iptables -t nat -L
Chain PREROUTING (policy ACCEPT)
target     prot opt source               destination

Chain INPUT (policy ACCEPT)
target     prot opt source               destination

Chain OUTPUT (policy ACCEPT)
target     prot opt source               destination

Chain POSTROUTING (policy ACCEPT)
target     prot opt source               destination
SNAT       all  --  anywhere             anywhere            to:172.22.9.100
SNAT       all  --  anywhere             anywhere            to:172.22.1.130


# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 brd 127.255.255.255 scope host lo
    inet 127.0.0.2/8 brd 127.255.255.255 scope host secondary lo
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UNKNOWN         qlen 1000
    link/ether 00:50:56:a5:77:ae brd ff:ff:ff:ff:ff:ff
    inet 192.168.8.216/22 brd 192.168.11.255 scope global eth0
3: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UNKNOWN         qlen 1000
link/ether 00:50:56:a5:77:af brd ff:ff:ff:ff:ff:ff
inet 172.22.9.100/22 brd 172.22.11.255 scope global eth1:1
inet 172.22.8.213/22 brd 172.22.11.255 scope global secondary eth1
4: eth2: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UNKNOWN qlen 1000
    link/ether 00:50:56:a5:77:b0 brd ff:ff:ff:ff:ff:ff
    inet 172.22.1.130/24 brd 172.22.1.255 scope global eth2


# cat /proc/sys/net/ipv4/ip_forward
1
# cat /proc/sys/net/ipv4/vs/conntrack
1
# cat /proc/sys/net/ipv4/vs/expire_nodest_conn
1
# cat /proc/sys/net/ipv4/vs/expire_quiescent_template
1
4

1 回答 1

1

首先 - 您不能通过将权重更改为 0 来进行测试...您必须从 ipvs 表中完全删除该条目以模拟故障服务器。

您已告诉 ldirectord 保持死服务器存活: quiescent = yes 您需要将其更改为: quiescent = no(这会将条目从表中删除)

看起来您确实正确设置了以下值: expire_nodest_conn - BOOLEAN expire_quiescent_template - BOOLEAN

此处说明:https ://www.kernel.org/doc/Documentation/networking/ipvs-sysctl.txt

于 2013-11-08T11:29:41.297 回答