问题标签 [crrri]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
197 浏览

r - 如何在 crrri 异步函数中设置 chrome bin?

当我尝试使用 crrri 运行异步函数时,我收到错误消息:"Error: Cannot launch Chrome. Please add the path to your Chrome bin."

我猜错误消息试图告诉我 crrri 找不到我的 chrome 可执行文件。所以我尝试在我的函数定义上方添加以下代码(到全局环境)

但错误信息保持不变。

这是我试图运行的代码:

预期的结果将是打印网站到保存到我的 PWD 的 pdf 文件。

0 投票
1 回答
413 浏览

r - 使用 RStudio Chromote 获取页面生成的 XHR 请求的响应正文的正确方法

我想使用 Chromote 来收集网站发出的 XHR 调用的响应主体,但我发现 API 掌握起来有点复杂,尤其是异步管道。

我想我需要先启用网络功能,然后加载页面(可以这样做),但是我需要:

  • 列出所有 XHR 调用
  • 通过识别请求 URL 中的模式来过滤它们
  • 访问所选来源的请求正文

有人可以提供这方面的任何指导或教程材料吗?

更新:好的,我切换到包crrri并为此目的制作了一个通用功能。唯一缺少的部分是一些逻辑来决定何时关闭连接并返回结果:

0 投票
0 回答
72 浏览

r - 使用 crrri 包和无头 chrome 向下滚动页面

我正在尝试抓取一个执行 javascript 的网站,并在用户向下滚动时添加新信息。我使用这个函数来获取 DOM:

我找不到如何在无头 chrome 中滚动页面,所以我尝试通过在函数中添加以下行来更改窗口大小,但无济于事:

所以问题是 - 我如何将页面向下滚动到底部?或者,如何使“窗口大小”足够大以加载整个页面而无需向下滚动?

0 投票
1 回答
18 浏览

r - crrri 等到页面加载完毕

嗨,我正在使用 crrri R 包构建刮板,我有一个异步函数来转储 DOM,但即使我在循环中有 Page$loadEventFired(),我仍然会得到空白。

试图创建运行时事件,该事件将等到我从页面中获取元素,但我对承诺感到困惑,无法让它发挥作用。有任何想法吗?

等待函数

整个代码

0 投票
1 回答
15 浏览

r - 无法在 Mac OS 上安装 crrri 包

尝试在 Mac OS 上安装 headless chrom crrri 软件包时遇到以下错误 remotes::install_github('rlesur/crrri')

正在下载 GitHub repo rlesur/crrri@HEAD 正在运行R CMD build...

  • 检查文件'/private/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T/RtmpinLlHt/remotes2f540ee01d2/Rlesur-crrri-69c54e6/DESCRIPTION' ... OK
  • 准备“crrri”:
  • 检查DESCRIPTION元信息...好的
  • 检查源代码中的 LF 行尾并生成文件和 shell 脚本
  • 检查空目录或不需要的目录 从DESCRIPTION中省略'LazyData'
  • 构建'crrri_0.0.13.tar.gz' 警告:无效包'/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T//RtmpinLlHt/file2f549b9a34b/* 构建'crrri_0.0.13.tar.gz'' 错误:错误:未指定包警告消息:在 ip(...) 中:安装包 '/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T//RtmpinLlHt/file2f549b9a34b/* building 'crrri_0.0.13.tar.gz'' 退出状态非零