2

我必须处理格式密集的 HTML 中的问题,这实际上是不可读的,所以我想要一个库来“漂亮地打印”、格式化、美化或在管理此 HTML 的 .NET 应用程序中调用它。

目前,我将其复制并粘贴到 Visual Studio 2012 中并对其进行格式化,然后将其粘贴回应用程序中,但这变得有点乏味。

如果它可以有效地逆转过程并在我解决问题后去除所有空白区域,那也会很方便。

顺便说一句,我知道更改 HTML 的格式有时会导致意想不到的结果(我在看你的 IE),但我可以忍受。

4

1 回答 1

4

查看.NET/Mono 的 Html Tidy

从项目页面:

整洁管理

这是一个托管的 .NET/Mono 包装器,用于开源、跨平台的 Tidy 库、HTML/XHTML/XML 标记解析器和清洁器,最初由 Dave Raggett 创建。

和示例用法:

using System;
using TidyManaged;

public class Test
{
  public static void Main(string[] args)
  {
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
    {
      doc.ShowWarnings = false;
      doc.Quiet = true;
      doc.OutputXhtml = true;
      doc.CleanAndRepair();
      string parsed = doc.Save();
      Console.WriteLine(parsed);
    }
  }
}

看起来它应该完美地满足您的需求。

于 2013-02-27T19:46:05.553 回答