1

我有一个完整的 HTML 字符串。它看起来像这样:

<html>
  <head>
  </head>
  <body>
    This is a test
     <img width=403 height="302" id="someid1" src="http://mysite.com/images1">
     <img width="456" height=300 src="http://mysite.com/images2" id="someid2">
  </body>
</head>

我想做的是清理源头。我只想删除 img 标签中的所有宽度和高度。我想保留 ID 和 SRC 属性。

4

1 回答 1

3

您在这里不需要正则表达式。使用像HtmlAgilityPack这样的 html 解析器会更好..

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

foreach (var img in doc.DocumentNode.Descendants("img"))
{
    img.Attributes.Remove("width");
    img.Attributes.Remove("height");
}

var newhtml = doc.DocumentNode.OuterHtml;
于 2013-08-06T20:42:50.330 回答