1

我有一个<img />which src 属性正在由 javascript 脚本动态设置 - 所以<img src="http://1.2.3.4/some_image.jpg?m=3681368312" />现在是,一秒钟后<img src="http://1.2.3.4/some_image.jpg?m=1234234" />。我想使用 python 来加载这个图像并保存它。问题是当我加载 html 时, src 属性是空的 - 它是稍后设置的,所以当我加载它时我得到<img src="" />. 第二个问题是地址的 IP 部分可能会随着时间而变化。我希望我的解决方案是通用的,并且当供应商方面的某些事情必须发生变化时不必更改我的代码。有没有办法加载这个动态变化的内容?

编辑:

我当然知道,我可以对 javascript 行为进行逆向工程 - 解析 js 脚本,获取当前加载的 ip 并生成随机令牌,但我想避免这种情况......

4

1 回答 1

0

要获得 'src' 或您的 'img' 而无需对 javascript 进行逆向工程,您必须在“浏览器”中执行它。

在 python 中,为此,我使用 PyQt4 (QtCore, QtGui, QtWebKit)

这是一个例子:https ://github.com/JulienPalard/PyWebScrap

于 2013-01-27T16:06:12.040 回答