3

我从 DB 得到这个 HTML 字符串:-

<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage.jpg" width="612" height="612" /><p>Going by the Itinerary, we will be at the official launch on the 22nd May.</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage1.jpg" width="612" height="612" />

如您所见,在字符串中有两个图像标签。我想获得第一个图像标签的来源,例如:-

http://www.domain.com/uploads/myimage.jpg

谁能建议我如何从 html 字符串中获取此文本。

提前致谢

4

3 回答 3

13

您可以为此使用HtmlAgilityPack 之类的 html 解析器

string html = .......
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var link = doc.DocumentNode.SelectSingleNode("//img").Attributes["src"].Value;
于 2013-05-21T07:44:01.577 回答
3

我会推荐 HTML Agility 包:http ://htmlagilitypack.codeplex.com/wikipage?title=Examples有一个例子甚至展示了如何做到这一点。

于 2013-05-21T07:37:03.613 回答
1

使用string.Substring查找单词src

记住它出现的位置。

然后再一次,您也可以使用它来检查“”嵌入字符串何时结束。

于 2013-05-21T07:40:27.597 回答