python - 使用 Python 模拟浏览器资源扩展行为

Question

我正在寻找一种模拟浏览器资源扩展行为的方法。

我试图解决的流程如下：

我不希望跟随链接（href），只有在第一次访问页面时浏览器会自动获取的页面资源。

你对如何进行这个模拟有什么建议吗？

是否有任何 Python 项目/库可以提供帮助？

谢谢

score 1 · Accepted Answer

你可能想看看Scrapy。

它可能无法提供您需要的所有确切功能，但可以轻松扩展以实现此目的。

score 1 · Accepted Answer

您可能希望查看Windmill 测试框架，它允许您使用 Python 为 Web 应用程序编写测试。

score 1 · Accepted Answer

您可能想查看spider.py和robotsparser。除非那些自动执行您想要的操作，否则您可以使用BeautifulSoup自己深入研究 HTML 汤。

3 回答 3