问题标签 [crrri]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 crrri 异步函数中设置 chrome bin?
当我尝试使用 crrri 运行异步函数时,我收到错误消息:"Error: Cannot launch Chrome. Please add the path to your Chrome bin."
我猜错误消息试图告诉我 crrri 找不到我的 chrome 可执行文件。所以我尝试在我的函数定义上方添加以下代码(到全局环境)
但错误信息保持不变。
这是我试图运行的代码:
预期的结果将是打印网站到保存到我的 PWD 的 pdf 文件。
r - 使用 RStudio Chromote 获取页面生成的 XHR 请求的响应正文的正确方法
我想使用 Chromote 来收集网站发出的 XHR 调用的响应主体,但我发现 API 掌握起来有点复杂,尤其是异步管道。
我想我需要先启用网络功能,然后加载页面(可以这样做),但是我需要:
- 列出所有 XHR 调用
- 通过识别请求 URL 中的模式来过滤它们
- 访问所选来源的请求正文
有人可以提供这方面的任何指导或教程材料吗?
更新:好的,我切换到包crrri
并为此目的制作了一个通用功能。唯一缺少的部分是一些逻辑来决定何时关闭连接并返回结果:
r - 使用 crrri 包和无头 chrome 向下滚动页面
我正在尝试抓取一个执行 javascript 的网站,并在用户向下滚动时添加新信息。我使用这个函数来获取 DOM:
我找不到如何在无头 chrome 中滚动页面,所以我尝试通过在函数中添加以下行来更改窗口大小,但无济于事:
所以问题是 - 我如何将页面向下滚动到底部?或者,如何使“窗口大小”足够大以加载整个页面而无需向下滚动?
r - crrri 等到页面加载完毕
嗨,我正在使用 crrri R 包构建刮板,我有一个异步函数来转储 DOM,但即使我在循环中有 Page$loadEventFired(),我仍然会得到空白。
试图创建运行时事件,该事件将等到我从页面中获取元素,但我对承诺感到困惑,无法让它发挥作用。有任何想法吗?
等待函数
整个代码
r - 无法在 Mac OS 上安装 crrri 包
尝试在 Mac OS 上安装 headless chrom crrri 软件包时遇到以下错误 remotes::install_github('rlesur/crrri')
:
正在下载 GitHub repo rlesur/crrri@HEAD 正在运行
R CMD build
...
- 检查文件'/private/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T/RtmpinLlHt/remotes2f540ee01d2/Rlesur-crrri-69c54e6/DESCRIPTION' ... OK
- 准备“crrri”:
- 检查DESCRIPTION元信息...好的
- 检查源代码中的 LF 行尾并生成文件和 shell 脚本
- 检查空目录或不需要的目录 从DESCRIPTION中省略'LazyData'
- 构建'crrri_0.0.13.tar.gz' 警告:无效包'/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T//RtmpinLlHt/file2f549b9a34b/* 构建'crrri_0.0.13.tar.gz'' 错误:错误:未指定包警告消息:在 ip(...) 中:安装包 '/var/folders/6q/k8llt_rd5d3cc2tgx1fy8vth0000gn/T//RtmpinLlHt/file2f549b9a34b/* building 'crrri_0.0.13.tar.gz'' 退出状态非零