4

我正在使用 HTML Agility Pack 来验证我的 html。下面是我正在使用的,

public class MarkupErrors
{
    public string ErrorCode { get; set; }
    public string ErrorReason { get; set; }
}

public static List<MarkupErrors> IsMarkupValid(string html)
{
    var document = new HtmlAgilityPack.HtmlDocument();
    document.OptionFixNestedTags = true;
    document.LoadHtml(html);

    var parserErrors = new List<MarkupErrors>();
    foreach(var error in document.ParseErrors)
    {
        parserErrors.Add(new MarkupErrors
                             {
                                 ErrorCode = error.Code.ToString(),
                                 ErrorReason = error.Reason
                             });
    }

    return parserErrors;
}

所以说我的输入类似于下图所示:

<h1>Test</h1> 
Hello World</h2> 
<h3>Missing close h3 tag

所以我当前的函数返回以下错误列表

- Start tag <h2> was not found
- End tag </h3> was not found

这很好......

我的问题是我希望整个 html 都是有效的,即带有适当的<head>标签<body>,因为这个 html 稍后将可用于预览,下载为 .html 文件。

所以我想知道是否可以使用 HTML Agility Pack 进行检查?

任何想法或其他选择将不胜感激。谢谢

4

1 回答 1

5

您可以检查 HTML 元素下是否有 HEAD 元素或 BODY 元素,例如:

bool hasHead = doc.DocumentNode.SelectSingleNode("html/head") != null;
bool hasBody = doc.DocumentNode.SelectSingleNode("html/body") != null;

如果没有 HTML 元素,或者 HTML 元素下没有 BODY 元素,这些将失败。

注意我不使用这种 XPATH 表达式"//head",因为即使头部不在 HTML 元素的正下方,它也会给出结果。

于 2013-05-20T08:45:12.510 回答