我正在尝试使用 Windmill 编写一个简单的脚本来打开一个页面(其中包含 javascript),然后下载整个 html。我的代码是:
from windmill.authoring import setup_module, WindmillTestClient
from windmill.conf import global_settings
import sys
global_settings.START_FIREFOX = True
setup_module(sys.modules[__name__])
def my_func():
url = "a certain url"
client = WindmillTestClient(__name__)
client.open(url=cur_url)
html = client.commands.getPageText()
最后一行,与 getPageText() 似乎只是挂起。什么都没有发生,它永远不会回来。
另外,windmill每次都需要打开整个GUI吗?如果是的话,python中是否有一个函数可以在我完成后关闭它(指向任何实际文档的链接都会有所帮助;我发现的只是一些例子)?
编辑:仅使用 Selenium 解决了这个问题,花了大约 15 分钟而不是 3 小时试图让 Windmill 工作。我的一位同事提出了另一种解决方案,即实际观察进入浏览器的网络流量并抓取 GET 请求。虽然不完全确定他是如何做到的。