问题标签 [httr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
523 浏览

xml - 在 R 中抓取网页的问题

我正在尝试使用 XPath 抓取网页的特定位置以找到它。该路径似乎是“隐藏的”,因为网页的其他部分很容易到达,但此部分返回一个NULL值。

我试过使用几个包,但我真的不是这个主题的专家,所以我无法真正评估发生了什么以及是否可以解决它。

这是我尝试过的。

0 投票
1 回答
340 浏览

xml - 如何在 R 中抓取此网页?

我正在尝试使用 XML、RCurl 或 httr 库在 R 中抓取以下网页:http: //accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB

该网页在我的浏览器中正确打开。这是我抓取网页的尝试:

我收到 readHTMLTable 和 htmlParse 的以下错误:“错误:加载 HTTP 资源失败”。使用 GET,我收到状态代码 404,这表明找不到资源,并且我发送请求的方式可能存在错误。鉴于我可以在浏览器中打开网页,我不确定问题出在哪里。也许它是一种不同于功能预期的文件?有任何想法吗?

理想情况下,抓取将针对所有 146 个条目(不仅仅是前 25 个)。

0 投票
0 回答
392 浏览

r - 在 R 中使用 Genderize.io

我正在尝试找出一种将 Genderize.io API ( http://genderize.io ) 用于 R 中的数据集的方法。我在数据集中有大量名称要通过,所以最终想编写一个可以处理我的姓名列表的函数。不幸的是,这超出了我的 R 能力。我在想我应该使用 httr 包,但在阅读了该包的文档后仍然不知道该怎么做。我看到很多使用其他 API(Facebook、Twitter)的包或网站,但不确定如何将它们应用于此任务。任何帮助或想法将不胜感激。

谢谢!!

0 投票
1 回答
458 浏览

r - 由于环境锁定,无法在演示中运行链接

由于有关无法将变量添加到锁定环境的错误消息,我无法在 httr 中运行链接中的演示。特定的代码是 Hadley 必须扩展 Token2.0 以适应 LI 的非标准 oauth2

错误消息是:分配错误(mname,def,where):无法将绑定添加到锁定的环境

系统:MAC OS Mavericks R version 3.0.3 (2014-03-06) httr version 0.3

我还没有找到成功的解决方案

0 投票
0 回答
848 浏览

r - R httr 包的 GET 方法中的“路径”参数是干什么用的?

在文档中:

http://cran.r-project.org/web/packages/httr/httr.pdf,它只说:

然后在 modify_url 部分中,它说:

还有一个例子:

path = "/"但是(就像 R 文档中的许多示例一样,LOL!),该示例并没有说明使用vs之间的区别path = "search"

那么,是path为了什么?

0 投票
2 回答
26307 浏览

xml - 在 R 中抓取受密码保护的网站

我正在尝试从 R 中受密码保护的网站上抓取数据。四处阅读,似乎 httr 和 RCurl 包是使用密码身份验证进行抓取的最佳选择(我还研究了 XML 包)。

我试图抓取的网站如下(您需要一个免费帐户才能访问完整页面): http ://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2

这是我的两次尝试(用我的用户名替换“用户名”,用我的密码替换“密码”):

我查看了其他相关帖子(下面的链接),但无法弄清楚如何将他们的答案应用于我的案例。

如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件

如何在 R(https 链接)中抓取安全页面(使用 XML 包中的 readHTMLTable)?

从受密码保护的站点读取信息

R - RCurl 从受密码保护的站点中抓取数据

http://www.inside-r.org/questions/how-scrape-data-password-protected-https-website-using-r-hold

0 投票
0 回答
458 浏览

r - 编织错误“需要交互式环境”时对 github 的 API 调用

我在 R-Studio 控制台中对 github 的 API 调用工作得很好(httr 包),但每当我尝试编写 pdf 时就会中断。在控制台中,我必须在首次授权我的凭据时手动转到“localhost:1410”,但显然这在编织时无法发生。

产生的错误是

有什么建议或解决方法吗?

0 投票
1 回答
579 浏览

r - 从 R 查询 QPX Express

我正在尝试从 R (httr) 查询 QPX Exprs (Google),但无论出于何种原因,我都得到 0 个结果。这是我的查询:

这是命令:

最后,来自谷歌的回应:

有人对此有任何运气吗?

非常感谢!

卡洛斯

0 投票
1 回答
1908 浏览

r - R浏览器和GET / getURL之间的差异

我正在尝试从页面下载内容,但发现响应数据格式不正确或不完整,就好像 GET 或 getURL 在加载这些数据之前正在拉取一样。

我不确定如何进行。我的目标是获取与浏览器中显示的链接相关的数字:

所以在这种情况下,我想下载并抓取“9548”。

不知道为什么 getURL 和 GET 似乎得到的结果与浏览器中显示的结果大不相同。似乎数据加载缓慢,几乎就像 GET 和 getURL 在完全加载之前拉取一样。

例如,看:

0 投票
1 回答
1545 浏览

r - 无法通过代理连接 R

我正在尝试使用代理来抓取网页,但有些东西不起作用。这是设置代理选项的 httr 尝试,下面我尝试使用 RCurl。我已经阅读了有关该主题的几个答案,但它们似乎不起作用。有什么建议么?