1

下面是我正在使用的代码

import requests
import sys
import urllib, urllib2, cookielib

USERNAME = ''
PASSWORD = ''

URL = 'https://apps1.coned.com/cemyaccount/MemberPages/MyAccounts.aspx?lang=eng'

def main():
    # Start a session so we can have persistant cookies
    session = requests.session()

    # This is the form data that the page sends when logging in
    login_data = {
        'ctl00$Main$Login1$UserName': USERNAME,
        'ctl00$Main$Login1$Password': PASSWORD,
        'submit': 'Sign In',
    }

    # Authenticate
    r = session.post(URL, data=login_data)

    # Trying to access a page that requires you to be logged in
    r = session.get("https://apps1.coned.com/cemyaccount/MemberPages/MyAccounts.aspx?lang=eng")
    print r.status_code
    print r.headers
    print r.content

if __name__ == '__main__':
    main()

你好

我是 python 新手,面临一些问题。

登录后我需要页面的源页面,但问题是我也能够登录并获取代码,但是当我看到源页面时,我正在获取母版页的页面源代码,即标题而不是正文。

有人可以帮我吗?

4

1 回答 1

0

我想你正在寻找r.text

r.content用于二进制内容

对于不同的编码:

print(r.content.decode("ISO-8859-1"))或者

print(r.content.decode("cp1252"))

或者尝试将编码设置为空,以便 python 猜测:

r.text(在你用or做任何事情之前r.content):

r.encoding = ""
于 2013-11-07T13:01:32.563 回答