尝试使用以下 python 代码获取http://groupon.cl/descuentos/santiago-centro的 html 代码:
import urllib.request
url="http://groupon.cl/descuentos/santiago-centro"
request = urllib.request.Request(url, headers = {'user-agent' : 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'})
response = urllib.request.urlopen(request)
return response.read().decode('utf-8')
我正在获取询问我位置的页面的 html 代码。如果我用浏览器手动打开相同的链接(不涉及 cookie,即使是最近安装的浏览器),我会直接进入折扣促销页面。似乎是一些针对 urllib 没有发生的重定向操作。我正在使用用户代理标头来尝试获取典型浏览器的行为,但我没有运气。
如何获得与浏览器相同的 html 代码?