2

我正在尝试挖掘社交媒体数据,例如推文。然而,社交媒体数据有很多噪音——例如人们讨论名人或引用电影/电视/歌曲,这通常与他们自己或他们实际认识的人无关。

那么,是否有关于当前最流行名人的动态(即自动更新)数据库?他们所在的电影名言或他们唱的歌词也将是相关的。

4

1 回答 1

1

我认为不存在这样的精选列表。较小的确实存在,例如 Wikipedia 上的 100 部顶级电影名言。但是,这些都没有更新。

一种可能性是过滤掉出现在另一个跟踪趋势的社交媒体网站上的输入内容,例如Delicious。除非您正在寻找趋势,否则可能会上升到两个趋势网站顶部的东西......只是一种趋势。

Delicious为其 API提供了一个不错的 Python 包装器。

在 Pythonic 伪代码中,

 data = social-media.content
 data = filter(lambda datum: datum not in delicious.content-list,data)
于 2012-12-24T18:42:29.593 回答