6

众所周知,谷歌拥有不止一个 IP 地址。如果我们使用网站https://toolbox.googleapps.com/apps/dig/#A/google.com@8.8.8.8会产生多个 google 的 IP 地址。

如果我运行以下命令,那么情况会有所不同:

gyan@localhost:~/codes/java/net$ dig google.com

; <<>> DiG 9.10.3-P4-Ubuntu <<>> google.com
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 11777
;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4000
;; QUESTION SECTION:
;google.com.            IN  A

;; ANSWER SECTION:
google.com.     269 IN  A   216.58.220.46

;; Query time: 0 msec
;; SERVER: 10.100.171.1#53(10.100.171.1)
;; WHEN: Fri Nov 04 16:18:07 IST 2016
;; MSG SIZE  rcvd: 55

gyan@localhost:~/codes/java/net$ 

只返回一个IP地址,与上述网站返回的不一样。这个 IP 地址也会不时变化。

但是,如果我为 amazon.com 运行 dig 命令:

gyan@localhost:~/codes/java/net$ dig amazon.com

; <<>> DiG 9.10.3-P4-Ubuntu <<>> amazon.com
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 55090
;; flags: qr rd ra; QUERY: 1, ANSWER: 6, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4000
;; QUESTION SECTION:
;amazon.com.            IN  A

;; ANSWER SECTION:
amazon.com.     34  IN  A   54.239.26.128
amazon.com.     34  IN  A   54.239.17.7
amazon.com.     34  IN  A   54.239.25.192
amazon.com.     34  IN  A   54.239.25.208
amazon.com.     34  IN  A   54.239.25.200
amazon.com.     34  IN  A   54.239.17.6

;; Query time: 74 msec
;; SERVER: 127.0.1.1#53(127.0.1.1)
;; WHEN: Fri Nov 04 16:23:17 IST 2016
;; MSG SIZE  rcvd: 135

gyan@localhost:~/codes/java/net$ 

amazon.com 的这 6 个 IP 地址永远不会改变。网站 https://toolbox.googleapps.com/apps/dig/#A/amazon.com@8.8.8.8也返回相同的 6 个 IP 地址。

我的疑问是 google.com 的 DNS 查找与 amazon.com 有何不同?为什么 google 只产生一条记录,而不是像 amazon 这样的多条记录?

4

1 回答 1

9

众所周知,谷歌拥有不止一个 IP 地址。

真的。但这并不意味着客户需要了解其中的一个以上。

过去,服务使用多个 IP 地址响应 DNS 查询以执行负载平衡是很常见的。回复通常是随机的,这意味着客户端会从所有行为相同的服务器地址的大型池中获得几个地址的随机子集。

基于 DNS 的负载平衡一直是一个 hack。由于缓存存在问题:如果 ISP 的 DNS 解析器正在缓存回复,大量用户将全部连接到这几个 IP 地址,从而降低负载平衡的有效性。解决方法是降低记录的 TTL,以确保条目在缓存中保留一小段时间,然后执行新的查询。例如,您发布的 dig 输出中的 amazon.com A 记录的 TTL 设置为 34 秒。

该方法效果不佳。减少 TTL 会进一步增加小型 HTTP 请求的延迟。此外,DNS 负载平衡的结果有点不可预测,因为它不能保证服务器将统一处理负载。

但是,如果您有一个在网络级别工作的负载均衡器(将其视为反向 NAT 框:一个 IP 面向互联网,将流量多路复用到其后面的大量服务器),它可以处理大量连接,并且也有很好的正常运行时间,不需要在 DNS 级别做负载平衡。

因此,您连接的 Google 数据中心很可能不使用 DNS 负载平衡,而 Amazon 的数据中心使用。

另一个问题是为什么如果你从工具箱查询 8.8.8.8 会得到多个地址,而从你的机器查询却只得到一个。

首先,重要的是要了解从工具箱查询时,发送 DNS 查询的是 Web 服务器,而不是您的计算机。

DNS 服务器不必向不同的客户端返回相同的回复。实际上,根据客户端的地理位置返回不同的回复是很常见的:例如,如果欧洲的用户查询 google.com,它将获得欧洲数据中心的 IP 地址,而不是美国。

在这种情况下,我认为 DNS 地理定位用于某些客户端,而不用于其他客户端。它可能与发送查询的网络大小以及网络负载均衡器的容量有关。例如,如果负载均衡器可以同时处理 1,000,000 个连接,并且您发送查询的网络有 100,000 个 IP,则无需进行 DNS 负载均衡。但是如果网络很大(在您的示例中,运行工具箱的数据中心的大小,网络负载均衡器可能无法处理它,因此启用了 DNS 负载均衡,并且您从池中获取多个随机 IP 地址。

注意:“网络”是指使用相同 DNS 解析器的一组机器。

返回多个 IP 地址的另一个原因是进行基于 DNS 的故障转移。当其中一台机器停止工作时,客户端会尝试连接到另一台机器。但这不是进行故障转移的好方法,因为某些应用程序不会存储所有 IP 地址(尽管我认为大多数浏览器都会存储),而且 DNS 缓存会阻碍。

于 2016-11-04T15:24:04.990 回答