0

我正在使用以下代码来获取重定向 URL。

req = urllib2.Request(url_str, headers=hdrs)
real_url = urllib2.urlopen(req).geturl()

例如,如果我设置url_str = 'http://wearfigs.com'并运行代码,那么我最终会得到real_url = 'http://www.figsscrubs.com',这就是我想要的,因为在浏览器中,wearfigs.com 会重定向到 figsscrubs.com。

但是,当我尝试将 url_str 设置为http://www.greenforestry.us的相同过程时,它给我的 real_url 完全相同,即使浏览器重定向到http://www.greenforestry.us/GreenForestry。我们/Welcome.html。相同的netloc,不同的路径。我想在每种情况下都获得最终的重定向 URL,包括当 netloc 相同且路径不同时,就像上面的示例一样,但 geturl() 并没有起到作用。有办法吗?

4

0 回答 0