0

我已经注入了一些 url 来抓取一轮,我发现一些 url 为 db_redir_temp。{"url":"http://www.universityhealth.org","pst":"temp_moved(13), lastModified=0: https://www.universityhealth.org/"} {"url":"http ://silvercappartners.com","pst":"temp_moved(13), lastModified=0: http://silvercappartners.com/index.html"}

我可以知道http://www.universityhealth.org指向相同的 url 为什么显示 db_redir_temp。这个 url 指向 http://silvercappartners.com到这个 url http://silvercappartners.com/index.html 如果我认为 pst 列将给出重定向的 url 页面。

4

1 回答 1

1

两个网址

http://www.universityhealth.org
https://www.universityhealth.org/

在一个重要点上有所不同,协议(或方案) -httphttps. 这些并不总是等价的,例如。Web 服务器可能不支持https. 另一点(尾随/)无关紧要,空路径和服务器根路径的 HTTP 请求都是GET / HTTP/1.1(可能使用不同的协议版本)。

但真正的原因很简单,服务器响应的HTTP/1.1 302 Found是重定向,请参阅HTTP 302

“pst”或“协议状态”元数据字段可以包括消息。对于重定向,它包含重定向目标。

于 2020-10-26T19:32:39.197 回答