1

我有一个 MHTML 文件,我正在尝试将其转换为 HTML。

我已经安装了 HtmlAgilityPack 并尝试了以下代码:

var doc = new HtmlAgilityPack.MixedCodeDocument();
doc.Load("C:\\Users\\DickTracey\\Downloads\\Club Membership Report.mhtml");

var ms = new MemoryStream();
var sw = new StreamWriter(ms);

doc.Save(sw);
ms.Position = 0;

var sr = new StreamReader(ms);
return sr.ReadToEnd();

但它总是返回 null。

任何人都可以解释将 MHTML 转换为 HTML 的正确程序吗?

4

2 回答 2

0

C# 中的 MHTML 到 HTML 解码!

string mhtml = "This is your MHTML string"; // Make sure the string is in UTF-8 encoding MHTMLParser parser = new MHTMLParser(mhtml); string html = parser.getHTMLText(); // This is the converted HTML

git linkhttps ://github.com/DavidBenko/MHTML-to-HTML-Decoding-in-C-Sharp.git

于 2019-07-14T06:43:11.193 回答
0

我快速浏览了一个带有 HxD 的 MHTML 文件。尽管如上所述,HtmlAgilityPack 对 MHTML 的支持很少或根本不支持,但格式本身看起来很简单。它似乎由通常的可疑对象(未编码的 HTML、CSS、JS、以 Base64 编码的图形等)以某种方式(使用 mime 类型标头)连接起来,只需一点努力即可解决。话虽如此,该格式可能已在某处完整记录——因此请擦掉浏览器的灰尘,编写一些 C# 来解析它,然后用勺子喂食 HtmlAgilityPack 的结果。

于 2020-06-13T14:35:22.877 回答