问题标签 [rselenium]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1525 浏览

r - RSelenium - 使用 phantom.js 下载文件

使用RSelenium我可以使用通过 Firefox 浏览器的连接使用以下公式从网页下载文件:

当我尝试使用 phantomjs 浏览器复制该过程时,没有任何反应。猜测可能没有设置下载目录,我试过了:

仍然没有任何反应。感谢您知道需要发生什么才能使其正常工作。


编辑。

我应该在设置期间添加以下报告,这可能相关也可能不相关,尽管它似乎不会停止页面连接或元素选择:

0 投票
1 回答
329 浏览

r - AutoIt 和 RSelenium 导航另存为对话框 (Firefox)

我已经尝试了几天(如果不是几周的话......)让下面的代码工作。我想要实现的是每天运行一个 R 脚本(通过 Windows Server 2008 64 位上的批处理脚本和 Windows 任务计划程序)。该 R 脚本应导航到某些网站,登录并调用另存为对话框以将完整页面保存到特定路径。

如果我在 RStudio 中的机器(Win 8 - 64bit)上运行我的脚本,它就像一个魅力 - 远程和通过 Rscript.exe 它不会。

问题似乎出在 SaveAs.au3 脚本上——当我通过 RStudio 或文件资源管理器调用它时,它运行良好。在批处理文件中执行相同的 R 脚本:

一直工作到 system() 命令以及崩溃然后不提供任何错误或警告。

也许有人遇到类似问题并可以提供帮助?谢谢!

3 个 AutoIt 脚本如下:

SaveAs.au3/exe

EditName.au3将从 R 中可变地写入,然后调用

KeyEnter.aut3

R 脚本如下所示:

0 投票
1 回答
759 浏览

r - 如何使用 Rvest 和 phantomJS 从 HolidayIQ 中抓取所有酒店评论

我想使用 R 中的 Rvest 包从该酒店主页上抓取所有用户评论。

我只能检索前 10 条评论。通过单击由 JavaScript 生成的“查看更多”按钮来加载下一组评论。

我编写了以下 JavaScript - 'basic.js':

然后,我在 R 中使用了以下命令:

输出“taj.html”文件没有所有评论。所以,抓取代码...

... 仅返回前 10 条评论。

0 投票
0 回答
1899 浏览

r - RSelenium - 从表(和非表)中提取数据

今天我第一次尝试使用 RSelenium 从网站上抓取数据。我可以通过选项卡和下拉菜单导航到我需要的数据(难点?),但现在卡在提取我需要的实际数据的点(简单点!)

到目前为止,我的代码是:

有人可以建议现在将此播放器表中的数据提取为 csv 格式的最简单方法吗?我习惯于使用 XML 包和 readHTMLTable 来抓取其他(静态)网站,但我被困在如何将它与上面的 RSelenium 步骤结合起来。

谢谢

编辑 - 以全新的眼光回到这个问题,我找到的答案如下:

这使我可以在网站的这一部分继续我需要的东西。

如果可以的话,我想就同一站点的另一部分寻求帮助。我导航到我需要的数据,如下所示:

我想提取的数据在这些框中,但是由于 HTML 没有说它们是作为表格构建的,所以我真的不知道如何进行。

在此处输入图像描述

0 投票
1 回答
196 浏览

loops - RSelenium:遍历保管箱中的所有值

我正在尝试使用此链接为每个国家/地区与所有与艾滋病毒/艾滋病相关的非政府组织提供表格:https ://www.unodc.org/ngo/showExtendedSearch.do

我可以导航到 url 并选择“HIV/AIDS”单选按钮。但现在我还需要为 'region' 和 'country' 的 Dropbox 提取所有值,以便我可以在循环中使用它们来按顺序对每个国家/地区的表格进行网络抓取。如何收集两个 Dropbox 的值?到目前为止,我的代码如下:

0 投票
1 回答
369 浏览

r - Rselenium 错误...尝试在 Google Scholar 页面上单击“显示更多”

我正在使用 rvest 和 Rselenium 来抓取 Google Scholar 页面。我正在研究http://www.r-bloggers.com/google-scholar-scraping-with-rvest-package/中提供的示例。使用 RSelenium,我想单击 Google Scholar 页面上的“显示更多”按钮以获取所有出版物的列表。我正在运行的代码块是

其中 .gs_lbl 是 css 选择器 fr 显示更多,在最后一步我试图向它发送点击。但是,它会导致以下错误:

错误:摘要:ElementNotVisible 详细信息:无法完成元素命令,因为该元素在页面上不可见。类:org.openqa.selenium.ElementNotVisibleException >

我还使用选择器小工具来验证 .gs_lbl 是显示更多的 CSS 选择器......所以我不确定如何在此处继续。提前致谢!

0 投票
0 回答
300 浏览

r - RSelenium 将扩展添加到 R 中的 Firefox 配置文件

我正在尝试将 firefox 配置文件添加到添加扩展的 rselenium。到目前为止,这是我想出的:

我没有收到错误,但 firefox 在没有安装或加载插件的情况下打开。如何正确地将插件添加到 firefox?

0 投票
2 回答
738 浏览

xpath - 如何选择第二个

使用 Xpath 的元素

我正在尝试从网页上获取完整的评论。(完整评论 - 单击“阅读更多”按钮后)。我正在使用 RSelenium 进行此操作。我可以<p>使用代码从第一个元素中选择和提取文本

这是为了减少文本审查。

但无法使用代码提取全文评论

或者

它显示空白列表元素。我不知道出了什么问题。请帮我..

0 投票
1 回答
1593 浏览

r - R:下载嵌入网页的pdf

试图找到一种更简单的方法来获取此页面中嵌入的 pdf 中的表格,或者甚至更好,将此 pdf 下载到本地驱动器中:

我的代码在下面,结果很混乱......

PS:除非您使用 IE,否则网页底部的任何按钮都不起作用,而 IE 与 RSelenium... 我已经创建了一个在 IE 上加载页面的代码,可以成功单击任何按钮来加载 excel文件(卡在弹出窗口要求我打开或保存的步骤)或在当前窗口打开pdf,但同样的问题,不知道如何抓取pdf。所以到处都是死胡同。

提前致谢。

0 投票
1 回答
309 浏览

r - 与 RSelenium 一起使用时,for 循环不会遍历所有迭代

你好在这个网页上http://www.uefa.com/uefachampionsleague/season=2016/statistics/round=2000634/players/index.html

我正在尝试使用 RSelenium 单击所有作为链接的玩家名称,抓取单个玩家网页返回并继续使用另一个玩家

我运行此代码几次,但总是在一些迭代后得到错误Error in player[[i]] : subscript out of bounds

如果我在上次尝试中查找迭代器的值,它是 7,有时是 12 和其他数字。

我不知道为什么会收到此错误,因此感谢任何人的帮助!