我需要登录一个网站以在我正在做的项目的登录保护页面上访问其 html。
我将这个人的答案与我需要的值一起使用:
from twill.commands import *
go('https://example.com/login')
fv("3", "email", "myemail@example.com")
fv("3", "password", "mypassword")
submit()
假设这应该让我登录,然后我运行:
sock = urllib.urlopen("https://www.example.com/activities")
html_source = sock.read()
sock.close()
print html_source
我认为会打印(现在)可访问页面的 html,但只是给我登录页面的 html。我尝试了其他方法(例如使用机械化),但得到了相同的结果。
我错过了什么?某些网站是否限制了这种类型的登录,或者它不适用于 https 之类的?(该网站是 FitBit,因为我无法使用问题中的网址)