0

VB.NET 中是否有任何方法可以删除 HTML 中标签之间的所有空格?

说,我有这个:

<tr>
    <td>

我构建的字符串是一个完整的 HTML 文档,它会将这些标记之前的所有内容都视为合法空间,因此我需要将其修剪掉。那里有我可以用来执行此操作的 reg ex 或函数吗?

谢谢

4

2 回答 2

1

根据文档的复杂性,您可能只需要在文档中使用替换正则表达式...例如:

RegexObj.Replace(">[\s\n]*<","><")

您可以在此处阅读有关 .NET 和正则表达式的信息

于 2009-01-15T14:19:29.647 回答
0

上面的解决方案是一个好的开始,但是代码稍有错误,正则表达式超出了它的需要。在这种情况下,您需要做的最低限度是:

Dim RegexObj As New Regex(">[\s]*<")

NewText = RegexObj.Replace(OldText, "><")

\n是不必要的,因为 .Net 在空白字符集中包含回车符和换行符(\s)。不确定其他语言。如果没有,您还需要包含该\r字符,因为 Windows 换行符\r\n位于正则表达式中,而不仅仅是\n.

于 2009-01-15T14:44:24.073 回答