10

我设法将一个复杂网站的行为收集到一个网络档案中。此后,我想将该 webarchive 变成一组 html 嵌套目录。然而,当我使用 Waf 和在 Apple 商店购买的商业软件进行操作时,我得到的只是嵌套目录,底部有 html 页面,没有图像,也没有 css 和工作链接。如果您有兴趣,网络存档文档位于:

http://www.miafoto.it/it/GiroMilano.webarchive

而提取的弱乘积在:

http://www.miafoto.it/it/Giromilano/Pagine/default.aspx

和上面的空目录。In addition to the different look, the webarchive displays the same behavior as the official web site - when a listbox vales is selected and then the button pushed - while the extracted version produces a page with no contents by loading itself rather than the official page. 如您所见,网络存档超过 1MB,而提取文件仅略高于 1 KB。

它有什么问题,我如何才能以可用的结果执行如此看似微不足道的业务?

谢谢,

4

3 回答 3

7
textutil -convert html example.webarchive
  • 小心——带有文件的 html 是在与 webarchive 相同的文件夹中创建的!
  • 此外,我必须使用文本编辑器打开 .html 并替换“file:///image.tiff”链接(将“file:///”替换为“”),以便它们指向相对路径。
  • 此外,并非所有浏览器都显示 .tiff 图像。

谁知道我们有Stack Overflow wiki

于 2015-05-24T20:34:31.573 回答
0

我通过查找页面中提交的所有参数并将它们也提交到我的脚本中来解决这个问题,而忽略了 webarchive。

于 2012-12-12T11:51:57.020 回答
0

为了在 mac 上保存 HTML 页面,我使用 chrome。下载并安装它并将您的页面保存为 HTML。Safari 将使用 webarchiveformat 保存网页,对我来说,处理它非常困难。

于 2021-09-13T20:08:15.337 回答