也欢迎其他想法。我正在尝试获取一个excel文件,使用python为javascript html网页生成一个xml,该网页基本上将显示一个画廊(或某种目录结构)。excel 文件会非常庞大,但让我们假设时间不是那么重要。
到目前为止,我可以将制表符分隔的 Excel 电子表格版本转换为 XML,并且我拥有所有链接......现在,我只需要能够打开浏览器并截取屏幕截图并以正确的方式裁剪它们,或者保存网络内容的某些部分有些如何......
我正在考虑使用 selenium 作为网络爬虫,然后使用 autoit 执行键盘命令来保存所有网页,但这由于各种原因不起作用(而且它会非常慢)。
想法?
我看到发生“智能裁剪”的一个例子是在 camtasia 中,他们放大了屏幕的某些部分,他们认为应该聚焦。我认为这在某种程度上可以奏效。再说一次,我不知道如何准确地做出这样的假设。