问题标签 [rselenium]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

785 问题

0 投票

0 回答

139 浏览

r - Rselenium 点击链接 100 次

我必须阅读 Linkedin 上的评论，它一次只显示 10 条评论，并带有“显示上一条评论”链接。我有 1000 条评论，所以需要点击显示上一条评论 100 次才能看到所有评论。我想知道如何使用 Rselenium 在linkedin 页面上使用“clickElement()”100 次。之后，我希望将评论导出到电子表格或文本文件中。

这是代码

这使我可以单击一次，但我需要单击 100 次。

r function rselenium

2015-04-26T21:29:25.940

0 投票

1 回答

1023 浏览

r - 如何 clickElement() 并在同一选项卡中打开链接，而不是在新窗口中？

我的网页中有以下 html 元素：

我在 Rselenium 中使用以下命令来查找该标签：

然后我使用以下命令点击链接：

现在链接在新页面中打开，可能是因为 html 标记包含 target="PARENT"。如何在我在 remDr 中的同一选项卡中打开该链接？有什么建议么？谢谢

r selenium web-scraping rselenium

2015-04-28T01:22:09.320

0 投票

2 回答

6753 浏览

r - 如何使用 Rselenium 读取 html 表格？

我正在使用 Rselenium 导航到网页。下面的代码就是这样做的。我没有提供网址，因为我在需要 vpn 连接的公司中使用该网址：

导航到网页后，在 html 源代码中，我有下表：

现在的问题是我怎样才能拉出这个表的内容？请假设 url 不存在，否则我可以使用 XML 函数：readHTMLTable(remDr$getCurrentUrl())。但这由于某种原因不起作用。我只需要使用remoteDriver 句柄（remDr）。非常感谢您的时间

r selenium web-scraping rselenium

2015-04-29T00:57:15.867

0 投票

1 回答

152 浏览

html - 如何仅使用其链接文本来搜索网络链接的 xpath？R中的编码

我需要自动查找 href 链接（并找到它的“xpath”或“css 选择器”或...），以便通过 R 中的脚本单击该链接。在以下代码中，每次登录时所有标签都会更改，除了链接文本（例如以下代码中的“单击我获取更多信息”）。如何仅使用其链接文本来搜索此链接的 xpath/css 选择器？

html r xpath web-scraping rselenium

2015-04-30T21:31:51.197

0 投票

2 回答

1152 浏览

r - 硒| 获取 youtube 页面源

为什么 youtube.com 的页面来源不可抓取？

我尝试了以下方法（使用 phantomjs 以及带有 selenium 服务器的 chrome）

回报：

r selenium youtube selenium-chromedriver rselenium

2015-05-01T20:43:00.437

0 投票

1 回答

2446 浏览

r - R: Rvest - got hidden text i don't want

I'm doing webscraping to this web:

I just need the information from the products: "brand", "name of product", "price".

enter image description here

I can get that, but also i get the information from a banner with similar products by other users. I don't need it.

But when i go to the source code of the page, i can't see those products. I think it's been pulled through javascript or something:

enter image description here

QUESTION 1: How to block this information when doing the web scraping? This adds products that i don't need. But can't see this part in the source code.

QUESTION 2: When extracting prices "precio1", i get this as first element: "\n\t\t\t\tSubtotal InternetS/. 0" I can't see that in the code source neither. How to not scrape it?

r rvest rselenium

2015-05-30T01:59:19.417

0 投票

1 回答

159 浏览

casperjs - CasperJS 相当于 RSelenium 用于填写表单

我有一个 Rselenium 脚本来填写表格，但我正在尝试使用 CasperJS，因为我发现 Rselenium 太慢了。以下代码将按我的预期导航表单。

我尝试过的等效 CasperJS 代码如下；

卡斯珀的输出；

RSelenium的优点是不需要指定form参数，但想必casperJS需要这个。我应该改用什么？

我正在检查元素，但在这种情况下无法识别表单参数。一般如何处理这个问题？

casperjs rselenium

2015-06-15T10:55:49.017

0 投票

0 回答

446 浏览

r - 在 R phantomJS 中运行 Rselenium 在几次迭代后挂起

我正在使用 phantomJS 从不同的站点收集数据。在数据抓取过程中，我在解析站点或站点元素时遇到了很多崩溃。不幸的是，phantomJS 和 RSelenium 都没有在控制台中提供任何信息或包报告。脚本只是挂起而没有任何警告。我看到它正在执行，但实际上什么也没发生。阻止脚本执行的唯一方法是手动重启 R。经过几次测试，我发现 phantomJS 通常会在执行 remDr$findElements() 命令时挂起。我尝试使用 firefox 和 RSelenium 重新运行我的代码 - 它工作正常。所以问题在于 phantomJS 是如何工作的。

有没有人在运行 phantomJS 时遇到过类似的情况？是否有可能纠正这种不当行为？

我在用着：

Windows 7的
硒 2.0
R 版本 3.1.3
phantomjs-2.0.0-windows

我的代码：

r phantomjs rselenium

2015-06-17T11:00:45.847

0 投票

2 回答

4083 浏览

java - RSelenium UnknownError - Google Chrome 的 java.lang.IllegalStateException

我正在运行基于RSelenium Basics CRAN 页面的以下脚本：

这会产生以下错误：

根据GitHub 上此对话的评论，我修改了我的startServer()命令，如下所示：

然后我在控制台中收到以下错误：

并且在弹出的Java提示中出现这个错误：

我不确定缺少 Opera 驱动程序是实际错误还是警告。无论如何，我想使用 Chrome，所以这似乎无关紧要。我究竟做错了什么？

java r selenium rselenium

2015-06-29T20:11:44.567

0 投票

2 回答

1140 浏览

javascript - 使用 R 将字段添加到在线表单并抓取生成的 javascript 创建表

我正在尝试让 R 使用预定义的文本（例如 BN1 1NA）完成此网页http://cti.voa.gov.uk/cti/上的“按邮政编码搜索”字段，前进到下一页并抓取结果4 列表，根据邮政编码，可以跨越多页。为了使其更复杂，“改进指标”不是文本字段，而是图像文件（如使用邮政编码 BN1 3HP 搜索时所见）。我希望此列包含 0 或 1，具体取决于图像是否存在。

最终，我追求了一个很好的数据框，它反映了屏幕上的 4 列。

我试图修改这个问题的建议来做我上面描述的事情，但没有运气，老实说，我试图破译这个问题已经超出了我的深度。

我意识到 R 可能不是最适合我需要做的事情，但它是我可用的全部。任何帮助将不胜感激。

javascript r web-scraping phantomjs rselenium

2015-07-08T14:56:39.050

1 2 3 4 5 6 7 8 9 10

问题标签 [rselenium]

Reference