我想要用户的 Twitter 推文进行数据分析。为此,我使用了HtmlAgilityPack包来抓取 Twitter,它给了我 30 条热门推文。
我识别了 tweet-text 元素并获取了所有推文。但我想确定它是推文还是转推。我怎样才能做到这一点?
我已经分析了 HTML。在转推中将有一个具有tweet-context with-icn
类的元素。但是,当我在该类上抓取推文时,它会引发空异常,因为并非所有推文都具有该类。然后基于什么以及如何抓取以了解它是否转发?
代码:
HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load("https://twitter.com/BarackObama");
var TweetsNode= doc.DocumentNode.SelectNodes("//tr[@class='tweet-container']").ToList();
foreach (var item in TweetsNode)
{
var tweet = new Tweets
{
console.WriteLine(item.innertext);
};
}
在上面的代码中,我试图获取巴拉克奥巴马个人资料的推文。我收到了前 30 条推文。我如何识别哪一个是转发的?
谢谢你。