“rselenium”的相关标签问题

0 投票

2 回答

1525 浏览

r - RSelenium - 使用 phantom.js 下载文件

使用RSelenium我可以使用通过 Firefox 浏览器的连接使用以下公式从网页下载文件：

当我尝试使用 phantomjs 浏览器复制该过程时，没有任何反应。猜测可能没有设置下载目录，我试过了：

仍然没有任何反应。感谢您知道需要发生什么才能使其正常工作。

编辑。

我应该在设置期间添加以下报告，这可能相关也可能不相关，尽管它似乎不会停止页面连接或元素选择：

r phantomjs rselenium

2016-03-17T16:11:09.493

0 投票

1 回答

329 浏览

r - AutoIt 和 RSelenium 导航另存为对话框 (Firefox)

我已经尝试了几天（如果不是几周的话......）让下面的代码工作。我想要实现的是每天运行一个 R 脚本（通过 Windows Server 2008 64 位上的批处理脚本和 Windows 任务计划程序）。该 R 脚本应导航到某些网站，登录并调用另存为对话框以将完整页面保存到特定路径。

如果我在 RStudio 中的机器（Win 8 - 64bit）上运行我的脚本，它就像一个魅力 - 远程和通过 Rscript.exe 它不会。

问题似乎出在 SaveAs.au3 脚本上——当我通过 RStudio 或文件资源管理器调用它时，它运行良好。在批处理文件中执行相同的 R 脚本：

一直工作到 system() 命令以及崩溃然后不提供任何错误或警告。

也许有人遇到类似问题并可以提供帮助？谢谢！

3 个 AutoIt 脚本如下：

SaveAs.au3/exe

EditName.au3将从 R 中可变地写入，然后调用

KeyEnter.aut3

R 脚本如下所示：

r firefox autoit rselenium

2016-03-18T09:16:24.247

0 投票

1 回答

759 浏览

r - 如何使用 Rvest 和 phantomJS 从 HolidayIQ 中抓取所有酒店评论

我想使用 R 中的 Rvest 包从该酒店主页上抓取所有用户评论。

我只能检索前 10 条评论。通过单击由 JavaScript 生成的“查看更多”按钮来加载下一组评论。

我编写了以下 JavaScript - 'basic.js'：

然后，我在 R 中使用了以下命令：

输出“taj.html”文件没有所有评论。所以，抓取代码...

... 仅返回前 10 条评论。

r phantomjs rvest rselenium

2016-03-22T11:00:49.967

0 投票

0 回答

1899 浏览

r - RSelenium - 从表（和非表）中提取数据

今天我第一次尝试使用 RSelenium 从网站上抓取数据。我可以通过选项卡和下拉菜单导航到我需要的数据（难点？），但现在卡在提取我需要的实际数据的点（简单点！）

到目前为止，我的代码是：

有人可以建议现在将此播放器表中的数据提取为 csv 格式的最简单方法吗？我习惯于使用 XML 包和 readHTMLTable 来抓取其他（静态）网站，但我被困在如何将它与上面的 RSelenium 步骤结合起来。

谢谢

编辑 - 以全新的眼光回到这个问题，我找到的答案如下：

这使我可以在网站的这一部分继续我需要的东西。

如果可以的话，我想就同一站点的另一部分寻求帮助。我导航到我需要的数据，如下所示：

我想提取的数据在这些框中，但是由于 HTML 没有说它们是作为表格构建的，所以我真的不知道如何进行。

r web-scraping rselenium

2016-03-22T17:28:05.873

0 投票

1 回答

196 浏览

loops - RSelenium：遍历保管箱中的所有值

我正在尝试使用此链接为每个国家/地区与所有与艾滋病毒/艾滋病相关的非政府组织提供表格：https ://www.unodc.org/ngo/showExtendedSearch.do

我可以导航到 url 并选择“HIV/AIDS”单选按钮。但现在我还需要为 'region' 和 'country' 的 Dropbox 提取所有值，以便我可以在循环中使用它们来按顺序对每个国家/地区的表格进行网络抓取。如何收集两个 Dropbox 的值？到目前为止，我的代码如下：

loops drop-down-menu rselenium

2016-03-24T08:37:31.063

0 投票

1 回答

369 浏览

r - Rselenium 错误...尝试在 Google Scholar 页面上单击“显示更多”

我正在使用 rvest 和 Rselenium 来抓取 Google Scholar 页面。我正在研究http://www.r-bloggers.com/google-scholar-scraping-with-rvest-package/中提供的示例。使用 RSelenium，我想单击 Google Scholar 页面上的“显示更多”按钮以获取所有出版物的列表。我正在运行的代码块是

其中 .gs_lbl 是 css 选择器 fr 显示更多，在最后一步我试图向它发送点击。但是，它会导致以下错误：

错误：摘要：ElementNotVisible 详细信息：无法完成元素命令，因为该元素在页面上不可见。类：org.openqa.selenium.ElementNotVisibleException >

我还使用选择器小工具来验证 .gs_lbl 是显示更多的 CSS 选择器......所以我不确定如何在此处继续。提前致谢！

r rselenium

2016-03-25T14:19:28.140

0 投票

0 回答

300 浏览

r - RSelenium 将扩展添加到 R 中的 Firefox 配置文件

我正在尝试将 firefox 配置文件添加到添加扩展的 rselenium。到目前为止，这是我想出的：

我没有收到错误，但 firefox 在没有安装或加载插件的情况下打开。如何正确地将插件添加到 firefox？

r selenium rselenium

2016-04-01T08:06:19.310

0 投票

2 回答

738 浏览

xpath - 如何选择第二个
使用 Xpath 的元素

我正在尝试从该网页上获取完整的评论。（完整评论 - 单击“阅读更多”按钮后）。我正在使用 RSelenium 进行此操作。我可以<p>使用代码从第一个元素中选择和提取文本

这是为了减少文本审查。

但无法使用代码提取全文评论

或者

它显示空白列表元素。我不知道出了什么问题。请帮我..

xpath rselenium

2016-04-01T09:30:55.667

0 投票

1 回答

1593 浏览

r - R：下载嵌入网页的pdf

试图找到一种更简单的方法来获取此页面中嵌入的 pdf 中的表格，或者甚至更好，将此 pdf 下载到本地驱动器中：

我的代码在下面，结果很混乱......

PS：除非您使用 IE，否则网页底部的任何按钮都不起作用，而 IE 与 RSelenium... 我已经创建了一个在 IE 上加载页面的代码，可以成功单击任何按钮来加载 excel文件（卡在弹出窗口要求我打开或保存的步骤）或在当前窗口打开pdf，但同样的问题，不知道如何抓取pdf。所以到处都是死胡同。

提前致谢。

r pdf rselenium

2016-04-01T14:48:39.933

0 投票

1 回答

309 浏览

r - 与 RSelenium 一起使用时，for 循环不会遍历所有迭代

你好在这个网页上http://www.uefa.com/uefachampionsleague/season=2016/statistics/round=2000634/players/index.html

我正在尝试使用 RSelenium 单击所有作为链接的玩家名称，抓取单个玩家网页返回并继续使用另一个玩家

我运行此代码几次，但总是在一些迭代后得到错误Error in player[[i]] : subscript out of bounds。

如果我在上次尝试中查找迭代器的值，它是 7，有时是 12 和其他数字。

我不知道为什么会收到此错误，因此感谢任何人的帮助！

r for-loop rselenium

2016-04-03T19:13:57.847

问题标签 [rselenium]

Reference