1

我有阅读和提取 html 源代码'as given'(通过 urllib.request)的经验,但现在我想执行类似浏览器的操作(如填写表单,或从选项菜单中选择一个值),然后,当然,像往常一样阅读生成的 html 代码。我确实遇到了一些看起来很有希望的模块,但结果却不支持 Python 3。所以,我在这里要求提供所需的库/模块的名称,或者指向标准库中的解决方案,如果它在那里并且我没看到。

4

1 回答 1

3

通常许多网站(如 Twitter、facebook 或 Wikipedia)都提供他们的 API,让开发人员能够连接到他们的应用程序并以编程方式执行活动。对于您希望通过代码执行活动的任何网站,只需寻找他们的 API 支持。

如果您需要进行网页抓取,可以使用scrapy。但它只支持python 2.7.x。无论如何,您可以使用HTTP 客户端的请求和 HTML 解析的美丽汤

于 2012-12-08T20:23:58.987 回答