问题标签 [httr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - 在 R 中抓取网页的问题
我正在尝试使用 XPath 抓取网页的特定位置以找到它。该路径似乎是“隐藏的”,因为网页的其他部分很容易到达,但此部分返回一个NULL
值。
我试过使用几个包,但我真的不是这个主题的专家,所以我无法真正评估发生了什么以及是否可以解决它。
这是我尝试过的。
xml - 如何在 R 中抓取此网页?
我正在尝试使用 XML、RCurl 或 httr 库在 R 中抓取以下网页:http: //accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB
该网页在我的浏览器中正确打开。这是我抓取网页的尝试:
我收到 readHTMLTable 和 htmlParse 的以下错误:“错误:加载 HTTP 资源失败”。使用 GET,我收到状态代码 404,这表明找不到资源,并且我发送请求的方式可能存在错误。鉴于我可以在浏览器中打开网页,我不确定问题出在哪里。也许它是一种不同于功能预期的文件?有任何想法吗?
理想情况下,抓取将针对所有 146 个条目(不仅仅是前 25 个)。
r - 在 R 中使用 Genderize.io
我正在尝试找出一种将 Genderize.io API ( http://genderize.io ) 用于 R 中的数据集的方法。我在数据集中有大量名称要通过,所以最终想编写一个可以处理我的姓名列表的函数。不幸的是,这超出了我的 R 能力。我在想我应该使用 httr 包,但在阅读了该包的文档后仍然不知道该怎么做。我看到很多使用其他 API(Facebook、Twitter)的包或网站,但不确定如何将它们应用于此任务。任何帮助或想法将不胜感激。
谢谢!!
r - 由于环境锁定,无法在演示中运行链接
由于有关无法将变量添加到锁定环境的错误消息,我无法在 httr 中运行链接中的演示。特定的代码是 Hadley 必须扩展 Token2.0 以适应 LI 的非标准 oauth2
错误消息是:分配错误(mname,def,where):无法将绑定添加到锁定的环境
系统:MAC OS Mavericks R version 3.0.3 (2014-03-06) httr version 0.3
我还没有找到成功的解决方案
r - R httr 包的 GET 方法中的“路径”参数是干什么用的?
在文档中:
http://cran.r-project.org/web/packages/httr/httr.pdf,它只说:
然后在 modify_url 部分中,它说:
还有一个例子:
path = "/"
但是(就像 R 文档中的许多示例一样,LOL!),该示例并没有说明使用vs之间的区别path = "search"
。
那么,是path
为了什么?
xml - 在 R 中抓取受密码保护的网站
我正在尝试从 R 中受密码保护的网站上抓取数据。四处阅读,似乎 httr 和 RCurl 包是使用密码身份验证进行抓取的最佳选择(我还研究了 XML 包)。
我试图抓取的网站如下(您需要一个免费帐户才能访问完整页面): http ://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2
这是我的两次尝试(用我的用户名替换“用户名”,用我的密码替换“密码”):
我查看了其他相关帖子(下面的链接),但无法弄清楚如何将他们的答案应用于我的案例。
如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件
如何在 R(https 链接)中抓取安全页面(使用 XML 包中的 readHTMLTable)?
http://www.inside-r.org/questions/how-scrape-data-password-protected-https-website-using-r-hold
r - 编织错误“需要交互式环境”时对 github 的 API 调用
我在 R-Studio 控制台中对 github 的 API 调用工作得很好(httr 包),但每当我尝试编写 pdf 时就会中断。在控制台中,我必须在首次授权我的凭据时手动转到“localhost:1410”,但显然这在编织时无法发生。
产生的错误是
有什么建议或解决方法吗?
r - 从 R 查询 QPX Express
我正在尝试从 R (httr) 查询 QPX Exprs (Google),但无论出于何种原因,我都得到 0 个结果。这是我的查询:
这是命令:
最后,来自谷歌的回应:
有人对此有任何运气吗?
非常感谢!
卡洛斯
r - R浏览器和GET / getURL之间的差异
我正在尝试从页面下载内容,但发现响应数据格式不正确或不完整,就好像 GET 或 getURL 在加载这些数据之前正在拉取一样。
我不确定如何进行。我的目标是获取与浏览器中显示的链接相关的数字:
所以在这种情况下,我想下载并抓取“9548”。
不知道为什么 getURL 和 GET 似乎得到的结果与浏览器中显示的结果大不相同。似乎数据加载缓慢,几乎就像 GET 和 getURL 在完全加载之前拉取一样。
例如,看:
r - 无法通过代理连接 R
我正在尝试使用代理来抓取网页,但有些东西不起作用。这是设置代理选项的 httr 尝试,下面我尝试使用 RCurl。我已经阅读了有关该主题的几个答案,但它们似乎不起作用。有什么建议么?