我正在编写一个 Python 脚本来搜索火车票。所以我的第一步是尝试在https://venta.renfe.com/vol/inicioCompra.do进行票务搜索
我试过机械化,但它得到:
RuntimeError: maximum recursion depth exceeded while calling a Python object
我一打开网址,可能是由于该网站的格式不正确。
所以下一次尝试是使用 Python Requests 库,并使用我可以在 firebug 看到的相同请求标头。所以我的代码看起来像:
import requests
headers = {'Cache-Control': 'max-age=0',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Encoding': 'gzip,deflate,sdch',
'Accept-Language': 'es,en-GB;q=0.8,en;q=0.6',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36',
'Content-Length': '118',
'Content-Type': 'application/x-www-form-urlencoded',
'Connection': 'keep-alive',
'Host': 'venta.renfe.com'}
cookies = {'target': '_self',
'pagina': '/vol/index.do',
'mensajeErrorSesion': 'null (null-U014)',
'url_logout': '/vol/index.do',
'tipoUsuario': 'N',
'JSESSIONID': '0000W1mXLh9qNdE6l-qaEExFc9Y:15df38flv',
'org.springframework.web.servlet.i18n.CookieLocaleResolver.LOCALE': 'es_ES',
's_cc': 'true',
's_fid': '5C053C8CEF00A17B-2B7E62472A63CF66',
's_nr': '1377790666229-New',
'gpv_p6': 'Venta%3APagina%20Principal',
's_sq': 'renfeprod%3D%2526pid%253DVenta%25253APagina%252520Principal%2526pidt%253D1%2526oid%253Djavascript%25253AestacionesAccesibles%252528%252529%25253B%2526ot%253DA Host:venta.renfe.com Origin:https://venta.renfe.com Referer:https://venta.renfe.com/vol/inicioCompra.do'}
payload = {'IdOrigen': 'Madrid (*)',
'IdDestino': 'Oviedo',
'FechaIdaSel': '15/11/2013',
'FechaVueltaSel': '17/11/2013'}
r = requests.post('https://venta.renfe.com/vol/inicioCompra.do', data=payload, cookies=cookies, headers=headers)
print r
但后来我收到 501 HTML 代码错误:未实现。我想我遗漏了一些东西,可能是 cookie 信息,但我不知道从哪里获取该 cookie 信息,或者我是否遗漏了其他任何东西。
任何的想法?