我正在做一个项目,它将单个图像和文本文件存储在一个地方,就像一个时间胶囊。现在,几乎每个项目都可以保存为一个文件,如 DOC、PPT 和 ODF。但是完整的网页不能——它们被保存为单独的 HTML 文件和数据文件夹。我想将网页保存在一个存档中,虽然有多种解决方案,但没有“标准”。HTML 档案的最佳格式是什么?
微软有MHTML——基本上是一个完全编码为 MIME HTML 电子邮件的文件。它已经基于现有的标准,并且作为自己的 MHTML 被提议为rfc2557。这是一个好主意,它一直存在,除了它自 1999 年以来一直是“提议的标准”。另外,除了 IE 之外的实现也很麻烦。IE和Opera支持;带有繁琐扩展的 Firefox 和 Safari。
Mozilla 有Mozilla 存档格式——基本上是一个带有标记和图像的 ZIP 文件,元数据保存为 RDF。这是一个很棒的想法——Winamp 为皮肤做这个,ODF 和 OOXML 为他们的嵌入图像做这个。我喜欢这个,除了 1. 除了 Mozilla 没有其他人使用它, 2. 自 Firefox 1.5 以来唯一支持它的扩展没有更新。
数据 URI正变得越来越流行。您无需像 MHTML 或 MAF 那样引用外部位置,而是将文件直接编码为 base64 的 HTML 标记。根据您的观点,它被简化了,因为文件就在标记所在的位置。然而,支撑仍然有些弱。Firefox、Opera 和 Safari 毫无瑕疵地支持它;市场领导者IE仅在 IE8 时才开始支持它,即使在那时也有限制。
当然,还有“保存完整网页”,其中 HTML 标记保存为
"savedpage.html"
,文件保存在单独的"savedpage_files"
文件夹中。Afaik,每个人都这样做。它得到了很好的支持。但是必须处理两个独立的元素一点也不简单和精简。我的项目需要将它们放在一个存档中。
考虑到浏览器支持和易于编辑页面,您认为将网页保存在单个存档中的最佳方式是什么?什么是最好的“标准”?还是我应该只管处理 HTML 文件和单独的文件夹?为了我的项目,我可以支持它,但我最好避免它。