问题标签 [rselenium]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RSelenium - 使用 phantom.js 下载文件
使用RSelenium
我可以使用通过 Firefox 浏览器的连接使用以下公式从网页下载文件:
当我尝试使用 phantomjs 浏览器复制该过程时,没有任何反应。猜测可能没有设置下载目录,我试过了:
仍然没有任何反应。感谢您知道需要发生什么才能使其正常工作。
编辑。
我应该在设置期间添加以下报告,这可能相关也可能不相关,尽管它似乎不会停止页面连接或元素选择:
r - AutoIt 和 RSelenium 导航另存为对话框 (Firefox)
我已经尝试了几天(如果不是几周的话......)让下面的代码工作。我想要实现的是每天运行一个 R 脚本(通过 Windows Server 2008 64 位上的批处理脚本和 Windows 任务计划程序)。该 R 脚本应导航到某些网站,登录并调用另存为对话框以将完整页面保存到特定路径。
如果我在 RStudio 中的机器(Win 8 - 64bit)上运行我的脚本,它就像一个魅力 - 远程和通过 Rscript.exe 它不会。
问题似乎出在 SaveAs.au3 脚本上——当我通过 RStudio 或文件资源管理器调用它时,它运行良好。在批处理文件中执行相同的 R 脚本:
一直工作到 system() 命令以及崩溃然后不提供任何错误或警告。
也许有人遇到类似问题并可以提供帮助?谢谢!
3 个 AutoIt 脚本如下:
SaveAs.au3/exe
EditName.au3将从 R 中可变地写入,然后调用
KeyEnter.aut3
R 脚本如下所示:
r - 如何使用 Rvest 和 phantomJS 从 HolidayIQ 中抓取所有酒店评论
我想使用 R 中的 Rvest 包从该酒店主页上抓取所有用户评论。
我只能检索前 10 条评论。通过单击由 JavaScript 生成的“查看更多”按钮来加载下一组评论。
我编写了以下 JavaScript - 'basic.js':
然后,我在 R 中使用了以下命令:
输出“taj.html”文件没有所有评论。所以,抓取代码...
... 仅返回前 10 条评论。
r - RSelenium - 从表(和非表)中提取数据
今天我第一次尝试使用 RSelenium 从网站上抓取数据。我可以通过选项卡和下拉菜单导航到我需要的数据(难点?),但现在卡在提取我需要的实际数据的点(简单点!)
到目前为止,我的代码是:
有人可以建议现在将此播放器表中的数据提取为 csv 格式的最简单方法吗?我习惯于使用 XML 包和 readHTMLTable 来抓取其他(静态)网站,但我被困在如何将它与上面的 RSelenium 步骤结合起来。
谢谢
编辑 - 以全新的眼光回到这个问题,我找到的答案如下:
这使我可以在网站的这一部分继续我需要的东西。
如果可以的话,我想就同一站点的另一部分寻求帮助。我导航到我需要的数据,如下所示:
我想提取的数据在这些框中,但是由于 HTML 没有说它们是作为表格构建的,所以我真的不知道如何进行。
loops - RSelenium:遍历保管箱中的所有值
我正在尝试使用此链接为每个国家/地区与所有与艾滋病毒/艾滋病相关的非政府组织提供表格:https ://www.unodc.org/ngo/showExtendedSearch.do
我可以导航到 url 并选择“HIV/AIDS”单选按钮。但现在我还需要为 'region' 和 'country' 的 Dropbox 提取所有值,以便我可以在循环中使用它们来按顺序对每个国家/地区的表格进行网络抓取。如何收集两个 Dropbox 的值?到目前为止,我的代码如下:
r - Rselenium 错误...尝试在 Google Scholar 页面上单击“显示更多”
我正在使用 rvest 和 Rselenium 来抓取 Google Scholar 页面。我正在研究http://www.r-bloggers.com/google-scholar-scraping-with-rvest-package/中提供的示例。使用 RSelenium,我想单击 Google Scholar 页面上的“显示更多”按钮以获取所有出版物的列表。我正在运行的代码块是
其中 .gs_lbl 是 css 选择器 fr 显示更多,在最后一步我试图向它发送点击。但是,它会导致以下错误:
错误:摘要:ElementNotVisible 详细信息:无法完成元素命令,因为该元素在页面上不可见。类:org.openqa.selenium.ElementNotVisibleException >
我还使用选择器小工具来验证 .gs_lbl 是显示更多的 CSS 选择器......所以我不确定如何在此处继续。提前致谢!
r - RSelenium 将扩展添加到 R 中的 Firefox 配置文件
我正在尝试将 firefox 配置文件添加到添加扩展的 rselenium。到目前为止,这是我想出的:
我没有收到错误,但 firefox 在没有安装或加载插件的情况下打开。如何正确地将插件添加到 firefox?
xpath - 如何选择第二个使用 Xpath 的元素
我正在尝试从该网页上获取完整的评论。(完整评论 - 单击“阅读更多”按钮后)。我正在使用 RSelenium 进行此操作。我可以<p>
使用代码从第一个元素中选择和提取文本
这是为了减少文本审查。
但无法使用代码提取全文评论
或者
它显示空白列表元素。我不知道出了什么问题。请帮我..
r - R:下载嵌入网页的pdf
试图找到一种更简单的方法来获取此页面中嵌入的 pdf 中的表格,或者甚至更好,将此 pdf 下载到本地驱动器中:
我的代码在下面,结果很混乱......
PS:除非您使用 IE,否则网页底部的任何按钮都不起作用,而 IE 与 RSelenium... 我已经创建了一个在 IE 上加载页面的代码,可以成功单击任何按钮来加载 excel文件(卡在弹出窗口要求我打开或保存的步骤)或在当前窗口打开pdf,但同样的问题,不知道如何抓取pdf。所以到处都是死胡同。
提前致谢。
r - 与 RSelenium 一起使用时,for 循环不会遍历所有迭代
你好在这个网页上http://www.uefa.com/uefachampionsleague/season=2016/statistics/round=2000634/players/index.html
我正在尝试使用 RSelenium 单击所有作为链接的玩家名称,抓取单个玩家网页返回并继续使用另一个玩家
我运行此代码几次,但总是在一些迭代后得到错误Error in player[[i]] : subscript out of bounds
。
如果我在上次尝试中查找迭代器的值,它是 7,有时是 12 和其他数字。
我不知道为什么会收到此错误,因此感谢任何人的帮助!