问题标签 [pyppeteer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 如何在pyppeteer中通过xpath获取元素属性
ElementHandle.Jeval()
我正在尝试style
通过Pyppeteer
. 但问题是我只能解决元素,xpath
因为元素class
是dynamically generated
.
但是,要求ElementHandle.Jeval()
作为selector
参数之一。
我试过了:
它仍然需要选择器。我试图get selector
从我通过 xpath 寻址的 ElementHandle 中找到一种方法,但没有找到允许我这样做的方法。
和:
如果有人能弄清楚这一点,请告诉我。谢谢。
- - - - - - - - -更新 - - - - - - - -
我通过编辑源代码弄清楚了:
但是,我不想这样做。如果有人有更好的方法,请告诉我。谢谢。
python-3.x - 使用 playwright-python 下载 pdf 文件
我正在尝试使用playwright
(Python)下载在浏览器中呈现的 PDF 文件(未显示为弹出窗口或下载)。没有公开 URL,因此您不能简单地抓取链接并使用requests.get("file_url")
.
我试过了:
我也试过page.expect_popup()
没有运气。我的理解是,这不能使用 来完成pyppeteer
,但如果可能的话,也欢迎这样的解决方案。
python - 由于 Pyppeteer 意外关闭,Python 程序在 aycnio 异常后挂起
我的 pyppeteer 连接意外关闭,它让我的 Python 程序挂起,而不是关闭并正确记录错误。有谁知道如何正确捕获此异常并正确退出 Python 程序?
这是我的脚本的一部分:
这是我收到的回溯:
python - 如何通过 Pyppeteer 获取搜索结果 URL?
我试图在我的 Python 程序中通过 Pyppeteer 抓取搜索结果的 url,但它不起作用......这是我的代码:
希望任何人都可以提供帮助!谢谢!
python - Pyppeteer 会话崩溃或超时
为了抓取 binance.com,我使用库 pyppeteer 来呈现网页并获得干净的 html 代码而不是 javascript 代码。
我的问题是:会话第一次在远程 Ubuntu 20.04 服务器上正常工作,但是当我再次运行代码时,我得到pyppeteer.errors.PageError: Page crashed!或pyppeteer.errors.TimeoutError: Navigation Timeout Exceeded: 超过 100000 ms。此外,当我从我的主 Windows 系统在 PyCharm 中运行代码时,该代码可以工作,但问题恰好发生在 ubuntu 上。
我认为这个问题与无人认领的 pyppeteer 会话有关,但我不确定。
这是我的代码:
这是崩溃错误日志:
javascript - 在 pyppeteer 中打印 Navigator 属性?
我想知道我的页面加载时加载了哪些导航器属性。这是我应该能够检索的一些属性,
https://www.w3schools.com/js/js_window_navigator.asp。
但是,似乎还有更多诸如:
window.navigator.webdriver
等未在上述页面上列出。
我希望能够在加载后打印所有属性和值。
我在文档中四处查看,但我看到的唯一参考是查询选择器的标签。
python - 如何错误检查 pyppeteer page.goBack()
我将如何错误检查铬浏览器是否有前一页可以访问?如果铬实例刚刚启动并且没有上一页可以使用命令 page.goback() 转到,我有一个按钮会冻结
python - 如何将 Network.webSocketFrameReceived 保存到 Python 字典。使用 Pyppeteer 库进行 UI 测试
我使用 Pyppeteer 库,因为有一个 Chrome 开发工具协议,并且在 UI 测试中发送请求后我可以接收 webSocketFrameReceived。我能够将套接字响应打印到终端,但这不是我想要的。我需要根据响应参数之一的状态(在屏幕截图https://www.screencast.com/t/4wKSIcPjL9T上标记)以不同的方式继续我的测试。我怎样才能做到这一点?如何处理套接字响应?保存 Python 字典的答案?任何想法
python - pyppeteer.errors.TimeoutError: Navigation Timeout Exceeded: 超过 30000 毫秒。尝试将 jupyter notebook 转换为 pdf 时
我使用 nbconvert 使用以下代码将笔记本转换为 pdf:
我得到以下输出:
那么这个错误:
这是什么意思 ?其他文件转换正常。Myb文件大小是问题,文件是2.5mb。