我有一些像下面这样的html:
<img src="/web/20110208042711im_/http://coralifeaqualight.com/wp-content/themes/xtheme/images/coralife-aqualight-pro.png" alt="">
我想要做的是使用正则表达式来清除任何没有值的html属性,在这种情况下:alt=""。我不知道如何查找任何带有空格并包含 ="" 的字符串,因为那会为我做,有人知道吗
使用 Regex 解析 HTML 通常被认为是一个坏主意,因为有太多的边缘情况。为自己阅读。http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
一个受欢迎的解决方案是HTML Agility Pack
另请参阅有关在 HTML 中使用 Regex 的 Stackoverflow 问题:这里
我不是正则表达式天才,但我相信String.Replace("\s\w+=\"\"", String.Empty)
如果你将整个标签放在一个字符串中,我会这样做。