我正在使用 SyndicationFeed 类来消耗一些文章的 rss 提要。我想知道如何只从项目的摘要字段中获取文本,而不需要 html 标签。例如,有时(并非总是)它包含 html 标签,例如:div、img、h、p 标签:/a>/div> ,img src='http"
我想摆脱所有标签。另外,我不确定它是否会在 RSS 提要中提供完整的描述。
我应该为此使用正则表达式吗?其他方法?
XmlReader reader = XmlReader.Create(response.GetResponseStream());
SyndicationFeed feed = SyndicationFeed.Load(reader);
foreach (SyndicationItem item in feed.Items)
{
string description= item.Summary; //This contains tags and not only the article text
}