我希望能够将 HTML 页面保存/存档为一个文件(没有那些讨厌的外部文件夹)。
我希望生成的文件包含所有样式、图像和链接(视频和 Flash 也不错,但不是那么重要)。
我希望生成的文件是可搜索和可编辑的。
微软的 MHT 就是这样的工具之一,但不幸的是,它在 Linux 下是不可搜索的。MHT很好,但我不想被锁定在一个操作系统或一个公司下。什么是一个好的选择——或者也许有一些我没有考虑过的完全不同的解决方案?
我希望能够将 HTML 页面保存/存档为一个文件(没有那些讨厌的外部文件夹)。
我希望生成的文件包含所有样式、图像和链接(视频和 Flash 也不错,但不是那么重要)。
我希望生成的文件是可搜索和可编辑的。
微软的 MHT 就是这样的工具之一,但不幸的是,它在 Linux 下是不可搜索的。MHT很好,但我不想被锁定在一个操作系统或一个公司下。什么是一个好的选择——或者也许有一些我没有考虑过的完全不同的解决方案?
SingleFile chrome 扩展是一个很好的解决方案。
我还编写了自己的 python 工具来解决这个问题,我建议尝试一下: https ://github.com/zTrix/webpage2html
通过切换 chrome://flags 页面上的“将页面另存为 MHTML”选项,支持在当前版本的 Google Chrome 中查看和创建 MHTML 文件。
在你的 url 框中输入 chrome://flags
但是,启用此实验性选项会禁用将页面保存为纯 HTML 或 HTML 完整文件。从 chrome://flags 页面:
扩展 zTrix 的答案,我建议避免使用 Chrome 扩展(这对我根本不起作用),而是使用以下选项之一:
npm
@import
通常,可以创建一个包含他所有常见子文件(css、jpg、js、svg...)
的 HTML 文件,您必须通过替换“ src
”属性值、“ url()
”函数和插入 HTML 标记来重写 HTML 文件比如 " <script></script>
" 用于 JavaScript 文件," <style></style>
" 用于 CSS 文件, " <svg></svg>
" 用于 SVG 图像。
例如,由“ url()
”函数调用的 CSS 中的 GIF 图像文件。
url('https://en.wikipedia.org/wiki/File:TPB_Magnet_Icon.gif')
" 为 " url('')
",前缀为 " data:image/gif;base64,
"你可以对“ src
”属性的值做同样的事情。此解决方案可用于其他二进制文件。您必须调整正确的“ data
”前缀以对应于编码对象。