我有一个包含数千条推文的 csv 文件。假设数据如下:
Tweet_id hashtags_in_the_tweet
Tweet_1 [trump, clinton]
Tweet_2 [trump, sanders]
Tweet_3 [politics, news]
Tweet_4 [news, trump]
Tweet_5 [flower, day]
Tweet_6 [trump, impeach]
如您所见,数据包含 tweet_id 和每条推文中的主题标签。我想要做的是去所有的行,最后给我一些类似值的东西:
Hashtag count
trump 4
news 2
clinton 1
sanders 1
politics 1
flower 1
obama 1
impeach 1
考虑到 csv 文件包含 100 万行(100 万条推文),最好的方法是什么?