5

我需要 html 解析,它能够识别生成的 html 中的错误,如果标签未关闭,则关闭它并返回有效的 html。

更多详细信息:我正在从数据库中获取数据并打破该记录以在我的网站上显示部分详细信息以单击更多按钮然后显示完整内容。断开字符串后验证。

我已经使用过 Html Agility Pack,但我是新手,如果这个库解决了我的问题,那么指导我如何(教程)或建议我另一个库。

4

2 回答 2

1

以下是来自万维网联盟 W3C 的几个验证程序:

Windows:http: //validator.w3.org/docs/install_win.html

UNIX/Linux:http: //validator.w3.org/docs/install.html

您还可以使用他们的 Web 服务来验证您的CSSHTMLXMLXHTMLJavaScript和许多其他 Web 技术。W3C是保持互联网高度互操作性和互联网设备相互兼容的监督者之一。

于 2011-01-28T12:23:22.340 回答
1

我不认为这样的图书馆确实存在。问题是,一些库确实可以识别您的 HTML 中的错误,但它们无法为您修复它们。

我认为使用W3C 验证器作为服务是最好的起点。有一个开源库,它使用 W3C 验证器的 API 来验证文档,并在文档有效或无效时为您提供响应以及错误和警告。我会从这个开始,然后从那里继续。

于 2011-01-28T13:17:44.527 回答