javascript - 使用getPageText（）时Python中的风车挂起

翻译自：https://stackoverflow.com/questions/29028747 2015-03-13T09:27:50.297

100 次

我正在尝试使用 Windmill 编写一个简单的脚本来打开一个页面（其中包含 javascript），然后下载整个 html。我的代码是：

from windmill.authoring import setup_module, WindmillTestClient
from windmill.conf import global_settings
import sys

global_settings.START_FIREFOX = True
setup_module(sys.modules[__name__])

def my_func():
    url = "a certain url"
    client = WindmillTestClient(__name__)
    client.open(url=cur_url)
    html = client.commands.getPageText()

最后一行，与 getPageText() 似乎只是挂起。什么都没有发生，它永远不会回来。

另外，windmill每次都需要打开整个GUI吗？如果是的话，python中是否有一个函数可以在我完成后关闭它（指向任何实际文档的链接都会有所帮助；我发现的只是一些例子）？

编辑：仅使用 Selenium 解决了这个问题，花了大约 15 分钟而不是 3 小时试图让 Windmill 工作。我的一位同事提出了另一种解决方案，即实际观察进入浏览器的网络流量并抓取 GET 请求。虽然不完全确定他是如何做到的。

javascript - 使用getPageText（）时Python中的风车挂起

0 回答 0

Related

Reference