问题标签 [pyppeteer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
976 浏览

python-3.x - 有没有办法在 pyppeteer 中滚动到页面末尾

我曾尝试查看文档等,但在将 pyppeteer 库与 python3 一起使用时无法找到向下滚动到页面底部的方法。

如果有人能指出我正确的方向或解决方案,那就太好了。

0 投票
1 回答
980 浏览

python - How to set up Accept-Encoding to gzip in Python pyppeteer and print pyppeteer headers?

  1. how to set headers for pyppeteer for example:Accept-Encoding: gzip
  2. how to print pyppeteer headers in python. i know java

result

0 投票
1 回答
102 浏览

python - 如何在地图上抓取 js 生成的活动数据

我是新的 python 用户,我想从这个网站上抓取数据:https ://www.telerad.be/Html5Viewer/index.html?viewer=telerad_fr

我的问题是数据是动态生成的。我读到了一些修复的可能性,但没有一个是令人满意的。使用 selenium,我需要一个名称或Xpath单击按钮,但这里什么都没有。

0 投票
0 回答
313 浏览

python - pyppeteer - 如何执行页面内的 javascript 函数?

我有这个元素:

我在浏览器上看起来像这样:

在此处输入图像描述

这是我的目标:

  1. 检查页面是否显示该错误
  2. 如果出现错误,请单击该refresh按钮

我该如何使用 pyppeteer 呢?对于这个愚蠢的问题,我很抱歉,总的来说,我对 pyppeteer 和 python 还是新手。

0 投票
1 回答
1304 浏览

javascript - 使用 Pyppeteer 获取阴影根中的元素内容

我有一个我感兴趣的对象的 JS 路径。这个路径包含很多影子根。

我正在尝试使用 python google-headless API 获取元素内容。由于 shadow-roots 我不能使用 page.querySelector。

所以,可能我必须在控制台中执行 JS-path 并获取输出。

pyppeteer可以吗?

0 投票
1 回答
1181 浏览

python - 脚本在执行过程中的某个时间点抛出一些错误

我使用pyppeteer在 python 中创建了一个脚本,以从网页中收集不同帖子的链接,然后通过重新使用这些收集的链接进入目标页面来解析每个帖子的标题。虽然内容是静态的,但我想知道 pyppeteer 在这种情况下是如何工作的。

我试图在函数和函数之间提供这个browser变量,以便我可以一遍又一遍地重用同一个浏览器。main()fetch()browse_all_links()

我目前的做法:

上面的脚本获取了一些标题,但在执行过程中的某个时刻会吐出以下错误:

0 投票
1 回答
569 浏览

python - 使用 pyppeteer 处理多个选项卡

我正在使用 peppeteer 检索网站数据,并希望打开另一个新选项卡(第二个选项卡)以检索更详细的数据。检索到指定数据后,新选项卡将关闭并切换回第一个选项卡。

我曾尝试成功打开另一个新选项卡并检索数据,但无法切换回第一个选项卡。

我希望第二个选项卡将关闭并切换回第一个选项卡,但浏览器已关闭而不是第二个选项卡。

0 投票
1 回答
1060 浏览

python - 无法让我的脚本执行下一页按钮上的所有点击

我使用pyppeteer在 python 中创建了一个脚本来收集遍历网站多个页面的不同机构的名称。我想做的是让我的脚本在解析每个页面的名称时单击下一页按钮来遍历不同的页面。

网站地址

我试过的:

上面的脚本运行良好,直到遇到 5 到 10 页之间的错误。但是,页面可能会有所不同。

但是,当我进行一个小的更改并像这样尝试时,我可以看到脚本也可以完成它的工作,直到它遇到以下错误:

我收到以下错误:

如何让我的脚本继续运行,直到执行所有点击?

0 投票
1 回答
680 浏览

python - 在 Python 多线程中调用 requests_html 或 pyppeteer ErrorError: signal only works in main thread

我大概了解到错误是由于在pyppeteer和requests_html中使用了协程io,这与多线程冲突,但我找不到解决这个问题的方法。我不太会说英语,我使用谷歌翻译。

我想调用 pyppeteer 或 requests_html 来模拟在多线程中浏览网页,但我总是收到错误“ValueError:信号仅在主线程中有效”或“RuntimeError:线程'Thread-1'中没有当前事件循环。” 试了很多方法,都无法成功运行,请大家帮忙,谢谢!

0 投票
2 回答
633 浏览

google-app-engine - Google App Engine 中的无头 chrome 浏览器在哪里

我正在寻找 Google App Engine(标准环境)中可执行文件的位置。

原因是我正在尝试使用 pyppeteer 进行某些工作,但 pyppeteer 总是将 chromium 下载到自定义文件夹中然后退出。

我看到 puppeteer 在 GAE 上工作,因此我希望我能说服 pyppeteer 也运行。

以下是 Google App Engine 日志: