1

这看起来真的很简单,但由于某种原因,这并没有正确连接到flurry,我无法抓取数据。

    loginurl = "https://dev.flurry.com/secure/loginPage.do"
    csvurl = "https://dev.flurry.com/eventdata"

    session = requests.Session()
    login = session.post(loginurl, data={'loginEmail': 'user', 'loginPassword': 'pass'})
    data = session.get(csvurl)

每次我尝试使用它时,我都会被重定向回登录屏幕(loginurl)而不获取新数据。有没有人能够像这样成功连接到flurry?

任何和所有的帮助将不胜感激,谢谢。

4

1 回答 1

1

还有两个表单字段要填充struts.token.name和struts.token.name的值,即token,您还必须发布到loginAction.do

在此处输入图像描述

您可以使用bs4进行初始获取并解析值,然后发布数据:

from bs4 import BeautifulSoup
import requests 

loginurl = "https://dev.flurry.com/secure/loginAction.do"
csvurl = "https://dev.flurry.com/eventdata"#
data = {'loginEmail': 'user', 'loginPassword': 'pass'}

with requests.Session() as session:
    session.headers.update({
        "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.82 Safari/537.36"})

    soup = BeautifulSoup(session.get(loginurl).content)
    name = soup.select_one("input[name=struts.token.name]")["value"]
    data["struts.token.name"] = name
    data[name] = soup.select_one("input[name={}]".format(name))["value"]
    login = session.post(loginurl, data=data)
于 2016-07-30T11:47:59.723 回答