4

尝试通过在MS Windows 上httr::user_agent的呼叫中更改用户代理时,我需要考虑什么特别的事情吗?httr::GET()我正在使用R-3.1.0httr 0.3

按照 的示例?user_agent,我得到以下结果:

url_this <- "http://httpbin.org/user-agent"

标准用户代理:

GET(url_this)   
Response [http://httpbin.org/user-agent]
  Status: 200
  Content-type: application/json
{
  "user-agent": "curl/7.19.6 Rcurl/1.95.4.1 httr/0.3"
} 

修改后的用户代理:

GET(url_this, user_agent("Mozilla/5.0"))
Response [http://httpbin.org/user-agent]
  Status: 200
  Content-type: application/json
{
  "user-agent": "curl/7.19.6 Rcurl/1.95.4.1 httr/0.3"
}

我原以为第二次调用会返回更接近我url_this在浏览器中访问时得到的结果:

{
  "user-agent": "Mozilla/5.0 (Windows NT 6.3; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0"
}

我在这里想念什么?也先运行setInternet2(TRUE),但得到相同的结果。

4

1 回答 1

7

非常好奇帮助页面?user_agent表明它应该可以工作。您可以显式设置标题并且它确实有效

> GET("http://httpbin.org/user-agent", add_headers("user-agent" = "Mozilla/5.0"))
Response [http://httpbin.org/user-agent]
  Status: 200
  Content-type: application/json
{
  "user-agent": "Mozilla/5.0"
} 

但给出的例子?user_agent似乎不是。

> GET("http://httpbin.org/user-agent", user_agent("Mozilla/5.0") )
Response [http://httpbin.org/user-agent]
  Status: 200
  Content-type: application/json
{
  "user-agent": "curl/7.19.6 Rcurl/1.95.4.1 httr/0.3"
} 
> 

它正在返回

> httr:::default_ua()
[1] "curl/7.19.7 Rcurl/1.95.4.1 httr/0.3"

我的 ISP 也在做一些时髦的事情,所以你可能需要:

GET("http://httpbin.org/user-agent", add_headers("user-agent" = "Mozilla/5.0", "Cache-Control" = "no-cache"))
于 2014-05-08T15:20:07.630 回答