0

也欢迎其他想法。我正在尝试获取一个excel文件,使用python为javascript html网页生成一个xml,该网页基本上将显示一个画廊(或某种目录结构)。excel 文件会非常庞大​​,但让我们假设时间不是那么重要。

到目前为止,我可以将制表符分隔的 Excel 电子表格版本转换为 XML,并且我拥有所有链接......现在,我只需要能够打开浏览器并截取屏幕截图并以正确的方式裁剪它们,或者保存网络内容的某些部分有些如何......

我正在考虑使用 selenium 作为网络爬虫,然后使用 autoit 执行键盘命令来保存所有网页,但这由于各种原因不起作用(而且它会非常慢)。

想法?

我看到发生“智能裁剪”的一个例子是在 camtasia 中,他们放大了屏幕的某些部分,他们认为应该聚焦。我认为这在某种程度上可以奏效。再说一次,我不知道如何准确地做出这样的假设。

4

1 回答 1

1

您可能可以使用pywebkitgtk来呈现 HTML,然后使用PIL来操作图像。

于 2010-01-13T22:49:21.913 回答