问题标签 [rcurl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 RCurl 中使用 cookie?
我正在尝试编写一个通过 REST API 访问一些数据的 R 包。但是,该 API 不使用 http 身份验证,而是依靠 cookie 来保存会话的凭据。
本质上,我想用两个 R 函数替换 bash 脚本中的以下两行:一个用于执行登录,并存储会话 cookie,第二个用于获取数据。
我显然不明白 RCurl 如何与 curl 选项一起使用。我的脚本目前有:
最后getURL()
以“未登录”失败。来自服务器的消息,并且在postForm()
没有cookies.txt
文件存在之后。
xml - 如何在 R 中从抓取的网页中隔离单个元素
我想用 R 来抓取这个页面:(http://www.fifa.com/worldcup/archive/germany2006/results/matches/match=97410001/report.html)和其他人,以获得进球者和时间。
到目前为止,这就是我所拥有的:
并且 pagetree 对象现在包含一个指向我解析的 html 的指针(我认为)。我想要的部分是:
但我现在不知道如何隔离它们,坦率地说xpathSApply
,xpathApply
让我迷惑不解!
那么,有谁知道如何制定一个命令来吸出<div class="cont">
标签中包含的元素?
r - 使用 R 通过 ssl 读取 csv 文件
现在全世界都在争先恐后地使用 SSL(这个决定很有意义)我们中的一些使用 github 和相关服务来存储 csv 文件的人有点挑战。从 URL 读取时,read.csv() 函数不支持 SSL。为了解决这个问题,我正在做一个小舞蹈,我喜欢称之为 SSL 歌舞伎舞蹈。我使用 RCurl 获取文本文件,将其写入临时文件,然后使用 read.csv() 读取它。有没有更流畅的方法来做到这一点?更好的解决方法?
这是 SSL 歌舞伎的一个简单示例:
r - 防火墙R后面的RCurl问题中的getURL
我在医院防火墙后面,通常必须使用setInternet2(T)
R 才能正确访问网络。但是运行我的代码(在家里完美运行)会导致
有没有可能解决这个问题?
问候,
//M
r - 如何使用 RODBC 或 RCurl 从 R 中受密码保护的 Sharepoint 2007 站点打开 Excel 2007 文件?
我有兴趣在R 2.11.1
使用RODBC
. Excel 文件位于 MOSS2007 网站的共享文档页面中。我目前将.xlsx
文件下载到我的硬盘驱动器,然后R
使用以下代码导入:
当我在odbcConnectExcel2007
连接中输入文档的 web url 时,会弹出一条错误消息:
接下来是我的 R 控制台中的以下消息:
您可以提供的任何见解将不胜感激。
谢谢!
**更新* *
我尝试下载的站点受密码保护。我尝试了另一种方法,使用包中的方法“getUrl” RCurl
:
x = getURL("http://website.com/file.xlsx", userpwd = "uname:pw")
我收到的错误是:
Error in curlPerform(curl = curl, .opts = opts, .encoding = .encoding) :
embedded nul in string: 'PK\003\004\024\0\006\0\b\0\0\0!\0dA»ï\001\0\0O\n\0\0\023\0Ò\001[Content_Types].xml ¢Î\001( \0\002\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\
我不知道这是什么意思。任何帮助,将不胜感激。谢谢!
optimization - 使用 Rcurl 计算页面元素的加载时间?(右)
我开始尝试使用 R 测试网页加载时间的想法。我设计了一个很小的 R 代码来做到这一点:
并以多种方式欢迎您的帮助:
- 是否可以这样做,但还要知道页面的哪些部分需要加载哪些部分?(类似于雅虎的YSlow)
- 我有时会遇到以下错误 -
curlPerform 中的错误(curl = curl,.opts = opts,.encoding = .encoding):从对等方接收数据时失败计时停止在:0.03 0 43.72
关于导致此问题的原因以及如何捕获此类错误并丢弃它们的任何建议?
你能想出改进上述功能的方法吗?
更新:我重做了这个功能。现在慢得让人心疼...
r - 使用 RCurl 的 POST 请求
作为探索如何在 R 中为 Denver RUG 制作包的一种方式,我决定围绕 datasciencetoolkit API 编写 R 包装器将是一个有趣的小项目。如您所想,基本的 R 工具来自 RCurl 包。我被困在一个看似简单的问题上,我希望这个论坛中的某个人能够指出我正确的方向。基本问题是我似乎无法使用 postForm() 将未键入的字符串作为 curl 中数据选项的一部分传递,即 curl -d "string" "address_to_api"。
例如,从命令行我可能会做
成功。但是,似乎 postForm() 在将其他参数传递到 POST 请求时需要一个显式键。我查看了 datasciencetoolkit 代码和开发人员文档以寻找可能的密钥,但似乎找不到任何东西。
顺便说一句,通过 GET 请求将输入传递给 DSTK API 的其他部分非常简单。例如,
将产生预期的结果。
为了清楚起见,我已经阅读了 DTL 的 omegahat 网站上的 RCurl 文档、带有包的 RCurl 文档以及 curl 手册页。但是,我缺少关于 curl 的一些基本内容(或者可能是 postForm() 函数中的 .opts() ),我似乎无法理解。
在 python 中,我基本上可以使用 httplib.HTTPConnection 发出一个“原始”的 POST 请求——在 R 中有类似的东西吗?我还查看了 httpRequest 包中的 simplePostToHost 函数,它似乎只是锁定了我的 R 会话(它似乎也需要一个密钥)。
FWIW,我在 Mac 10.6.7 上使用 R 2.13.0。
任何帮助深表感谢。如果您有兴趣使用数据科学工具包,所有代码很快就会在 github 上提供。
干杯。
r - 从网站中提取 html 表格
我正在尝试使用 XML、RCurl 包来读取以下 URL http://www.nse-india.com/marketinfo/equities/cmquote.jsp?key=SBINEQN&symbol=SBIN&flag=0&series=EQ#的一些 html 表
这是我正在使用的代码
如果您查看表格,则无法解析网页中的值。我猜这是由于一些 javascipt 评估在运行中发生的。现在,如果我在 google chrome 中使用“将页面另存为”选项(它在 mozilla 中不起作用)并保存页面,然后使用上面的代码,我就可以读取这些值。
但是有没有办法让我可以阅读苍蝇表?如果您能提供帮助,那就太好了。
问候,
xml - 使用 R 对房地产广告进行网页抓取
作为经济研究团队的实习生,我的任务是找到一种方法,使用 R 自动收集房地产广告网站上的特定数据。
我假设相关包是XML
and RCurl
,但我对他们工作的理解非常有限。
这是网站的主页:http: //www.leboncoin.fr/ventes_immobilieres/offres/nord_pas_de_calais/? f=a&th=1&zz= 59000 理想情况下,我想构建我的数据库,以便每一行对应一个广告。
这是广告的详细信息:http: //www.leboncoin.fr/ventes_immobilieres/197284216.htm? ca=17_s 我的变量是:价格(“Prix”),城市(“Ville”),表面( “表面”),“GES”,“Classe énergie”和房间数量(“Pièces”),以及广告中显示的图片数量。我还想将文本导出为字符向量稍后我将执行文本挖掘分析。
我正在寻找任何帮助、指向教程或操作方法的链接,这将引导我走上前进的道路。