我正在使用 Beautiful Soup 来尝试刮一页。
我正在尝试遵循本教程。
提交股票代码后,我试图获取以下页面的内容:
http://www.cboe.com/delayedquote/quotetable.aspx
本教程适用于具有“GET”方法的页面,我的页面是“POST”。我想知道这是否是问题的一部分?
我想使用第一个文本框——在它下面写着:
“在下方输入股票或指数代码以获取延迟报价。”</p>
相关代码:
user_agent = 'Mozilla/5 (Solaris 10) Gecko'
headers = { 'User-Agent' : user_agent }
values = {'ctl00$ctl00$AllContent$ContentMain$ucQuoteTableCtl$txtSymbol' : 'IBM' }
data = urllib.urlencode(values)
request = urllib2.Request("http://www.cboe.com/delayedquote/quotetable.aspx", data, headers)
response = urllib2.urlopen(request)
调用没有失败,我没有得到一组选项和价格,就像我以交互方式运行页面时一样。我一堆乱码的HTML。
提前致谢!