10

我有一个使用 selenium 的网络驱动程序,它为我打开一个浏览器,将它指向一个 ip 地址,做很多事情并关闭。

我想知道这段时间访问的所有 url。也就是说,任何已加载的广告、对任何 url 的任何 css 调用等等。

这是我使用的代码

from selenium import webdriver

browser = webdriver.Firefox(profile) # Get local session of firefox
browser.get(url) # Open a url and wait for it to finish
4

2 回答 2

1

我通过加载 firefox 插件 Firebug 和 Netexport 来做到这一点。第一个是允许您查看所有信息交换的工具,第二个允许将所有信息写入文件(.har 扩展名)。所以基本上 selenium 必须加载插件、网站并等待你想要的时间,当它关闭时,你会得到一个包含结果的文件。

于 2014-08-08T09:11:07.040 回答
1

它不是 python 解决方案。但是您可以将提琴手插件添加到 Firefox。大约一年前,我们需要做同样的事情。我们使用 selenium 打开浏览器和所有 UI 内容,并在后台 Fiddler 捕获了所有流量(http 和 https).. 这还列出了所有 JS CSS src,您可以稍后使用检查器进行调试,查看发送了哪些请求以及收到了哪些响应

于 2014-11-16T04:09:05.110 回答