我有一些 html 存储在数据库中。我不知道存储在数据库中的html 是否有额外的关闭div</div>
。我想在 html 字符串中找到额外的关闭 div。我试图找到使用HTML 敏捷包但没有找到实现这一目标的方法。例子:
<div class="readers">
A total of 218 users are reading this article.
</div>
</div>
</div>
我怎样才能找到这两个额外的关闭div并提取完全有效的 html。
在呈现 html 之前使用这个纯 javascript 解析器:http: //ejohn.org/blog/pure-javascript-html-parser/
您可以通过在此处粘贴代码来检查,
http ://ejohn.org/apps/htmlparser/
它删除了多余</div>
的 s。
您只需要将 html 传递给HTMLtoXML
函数,如下所示:
HTMLtoXML(your_html);
它会删除额外的结束标签。事实上,它的作用是将其转换为 xml 格式,但由于您正在处理 html 字符串,并且所有标签都应在 html 中有效,因此您可以安全地使用它。
编辑:您可以轻松地从 C# 文件调用 javascript 函数。有关更多详细信息,请参阅此问题。
单击此处查找未闭合(悬挂)以及额外的 div 标签:tormus