-4

我有一个很长的 HTML 代码 c# 字符串,我想专门提取项目符号“ <ul><li></li></ul>”。

假设我有以下 HTML 字符串。

var html = "<div class=ClassC441AA82DA8C5C23878D8>Here is a text that should be ignored.</div>This text should be ignored too<br><ul><li>*&nbsp;&nbsp;Need this one</li><li>Another bullet point I need</li><li>A bulletpoint again that I want</li><li>And this is the last bullet I want</li></ul><div>Ignore this line and text</div><p>Ignore this as well.</p>Text not important."

我需要 ' <ul>' 到 ' </ul>' 标签之间的所有内容。' <ul>' 标记可以被排除。

现在正则表达式不是我最强的一面,但如果可以使用,我需要一些帮助。我的代码在 c# 中。

4

1 回答 1

3

您应该将 HtmlAgilityPack 用于此类事情。前段时间我写了一个小介绍,可以帮助你开始:http ://colinmackay.scot/2011/03/22/a-quick-intro-to-the-html-agility-pack/

于 2013-06-28T08:06:24.510 回答