我必须处理格式密集的 HTML 中的问题,这实际上是不可读的,所以我想要一个库来“漂亮地打印”、格式化、美化或在管理此 HTML 的 .NET 应用程序中调用它。
目前,我将其复制并粘贴到 Visual Studio 2012 中并对其进行格式化,然后将其粘贴回应用程序中,但这变得有点乏味。
如果它可以有效地逆转过程并在我解决问题后去除所有空白区域,那也会很方便。
顺便说一句,我知道更改 HTML 的格式有时会导致意想不到的结果(我在看你的 IE),但我可以忍受。
我必须处理格式密集的 HTML 中的问题,这实际上是不可读的,所以我想要一个库来“漂亮地打印”、格式化、美化或在管理此 HTML 的 .NET 应用程序中调用它。
目前,我将其复制并粘贴到 Visual Studio 2012 中并对其进行格式化,然后将其粘贴回应用程序中,但这变得有点乏味。
如果它可以有效地逆转过程并在我解决问题后去除所有空白区域,那也会很方便。
顺便说一句,我知道更改 HTML 的格式有时会导致意想不到的结果(我在看你的 IE),但我可以忍受。
从项目页面:
整洁管理
这是一个托管的 .NET/Mono 包装器,用于开源、跨平台的 Tidy 库、HTML/XHTML/XML 标记解析器和清洁器,最初由 Dave Raggett 创建。
和示例用法:
using System;
using TidyManaged;
public class Test
{
public static void Main(string[] args)
{
using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
{
doc.ShowWarnings = false;
doc.Quiet = true;
doc.OutputXhtml = true;
doc.CleanAndRepair();
string parsed = doc.Save();
Console.WriteLine(parsed);
}
}
}
看起来它应该完美地满足您的需求。