我正在尝试开始自己进行网络抓取。现在我的目标是从moviepilot.de页面获取我个人评分的电影。
为此,我需要访问以下页面:http ://www.moviepilot.de/users/schlusie/rated/movies 。但是没有身份验证是不可能的。
我读过这个httr
包可以做这样的事情,把它保存为一个处理程序,handle
而不是用你的登录信息在主页上导航。从而访问所需的页面。它应该如下所示:
library(httr)
mp = handle("http://moviepilot.de")
# authentication step
GET(handle=mp, path="/users/schlusie/rated/movies")
这是登录页面:http ://www.moviepilot.de/login
有人可以给我任何指示吗?