5

我有时需要使用以下提供的 Beautiful Soup 和请求 URL 进行解析:

http://bit.ly/sdflksdfwefwe

http://stup.id/sdfslkjsfsd

http://0.r.msn.com/sdflksdflsdj

当然,这些 URL 通常会“解析”为规范 URL,例如http://real-website.com/page.html. 如何获取解析/重定向链中的最后一个 URL?

我的代码通常如下所示:

from bs4 import BeautifulSoup
import requests

response = requests.get(url)
soup = bs4.BeautifulSoup(response.text, from_encoding=response.encoding)
canonical_url = response.??? ## This is what I need to know

请注意,我并不是要查询http://bit.ly/bllsht以查看它的去向,而是当我使用 Beautiful Soup 已经解析它返回的页面时,可以获得重定向链中最后一个规范 URL。

谢谢。

4

1 回答 1

8

它在您的对象的url属性中。response

>>> response = requests.get('http://bit.ly/bllsht')
>>> response.url
  > u'http://www.thenews.org/sports/well-hey-there-murray-state-1-21-11-1.2436937'

您可以在“快速入门”页面中轻松找到此信息

于 2013-06-12T09:41:22.333 回答