1

我对这个 python 代码的目标是创建一种将工作信息获取到文件夹中的方法。第一步是不成功。运行代码时,我希望 url 打印https://www.indeed.com/。然而,代码返回https://secure.indeed.com/account/login。我愿意使用 urllib 或 cookielib 来解决这个持续存在的问题。

import requests
import urllib

data = {
        'action':'Login',
        '__email':'email@gmail.com',
        '__password':'password',
        'remember':'1',
        'hl':'en',
        'continue':'/account/view?hl=en',
       }


response = requests.get('https://secure.indeed.com/account/login',data=data)
print(response.url)
4

1 回答 1

2

如果你想从确实中抓取信息,你应该使用seleniumpython 库。

https://pypi.python.org/pypi/selenium

然后,您可以在正常浏览站点的真实用户的上下文中编写程序。

于 2017-08-07T23:02:21.060 回答