0

我正在尝试使用 R httr POST 请求登录到 bondora.com,因为该站点似乎没有使用身份验证:

library(httr)
login <- "https://www.bondora.com/en/login"
pars <- list(
    username = "MyUserName",
    password = "MyPassword"
    )
POST(login, body = pars)

登录后,网站将用户引导回登录页面 bondora.com/en/home,但如果我解析 POST 请求,我会得到与登录页面相同的页面标题:

library(XML)
test <- POST(login, body = pars)
test <- content(test, as = "text")
parsedHtml <- htmlParse(test, asText = TRUE)
xpathSApply(parsedHtml, "//title", xmlValue)
[1] "Join or log in|Loans and investing|Bondora"

我尝试在其他一些网站上使用相同的技术,它似乎工作得很好,除了这个网站。POST 命令的输出如下:

POST(login, body = pars)
   Response [https://www.bondora.com/en/login]
      Status: 200
      Content-type: text/html; charset=utf-8
   <!DOCTYPE HTML>
   <html xmlns="http://www.w3.org/1999/xhtml">

...

我应该使用一些特定的设置来登录到 bondora.com/en/login 吗?

更新 1 根据@hadley 评论,我厌倦了设置多部分 TRUE 和 FALSE,但没有帮助。然后我通过浏览器检查了请求并添加了相同的标头:

login <- "https://www.bondora.com/en/authenticate"
pars <- list(
  username = "username",
  password = "password"
  )
headers <- list(
  "User-Agent" = "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:28.0) Gecko/20100101 Firefox/28.0",
  "Referer" = "https://www.bondora.com/en/login?returnurl=/en/home",
  "Host" = "www.bondora.com",
  "Connection" = "keep-alive",
  "Accept-Language" = "en-US,en;q=0.5",
  "Accept-Encoding" = "gzip, deflate",
  "Accept" = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
  )
POST(login, body = pars, add_headers(.headers = character(headers)))
Error in character(headers) : invalid 'length' argument

似乎我需要像 HTML 错误 411 所指示的那样指定长度参数。我该怎么做?我还尝试Content-Length = 9844像在响应标头中一样添加到请求标头,但也没有成功。

4

1 回答 1

2

我可以通过将 httr_0.4 升级到 httr_0.5 来解决这个问题

于 2014-09-08T20:05:35.143 回答