我正在尝试使用 R 自动下载此网页上可用的收入动态面板研究文件。单击这些文件中的任何一个都会将用户带到此登录/身份验证页面。身份验证后,您可以使用 Web 浏览器轻松下载文件。不幸的是,下面的代码似乎没有维护身份验证。我已经尝试在 Chrome 中检查 Login.aspx 页面(如此处所述),但即使我相信我传递了所有正确的值,它似乎也无法维持身份验证。我不在乎它是否完成了httr
Headers
httr
RCurl
或其他东西,我只是喜欢在 R 中工作的东西,所以我不需要这个脚本的用户必须手动或使用一些完全独立的程序下载文件。我的尝试之一如下,但它不起作用。任何帮助,将不胜感激。谢谢!!:D
require(httr)
values <-
list(
"ctl00$ContentPlaceHolder3$Login1$UserName" = "you@email.com" ,
"ctl00$ContentPlaceHolder3$Login1$Password" = "somepassword" ,
"ctl00$ContentPlaceHolder3$Login1$LoginButton" = "Log In" ,
"_LASTFOCUS" = "" ,
"_EVENTTARGET" = "" ,
"_EVENTARGUMENT" = ""
)
POST( "http://simba.isr.umich.edu/u/Login.aspx?redir=http%3a%2f%2fsimba.isr.umich.edu%2fZips%2fZipMain.aspx" , body = values )
resp <- GET( "http://simba.isr.umich.edu/Zips/GetFile.aspx" , query = list( file = "1053" ) )