10

twitter 使用什么算法来确定您可以在search.twitter.com上看到的 10 个主题?我想实现该算法,并且还想展示 50 个最受欢迎的主题(而不是 10 个)。你能描述一下最有效的算法吗?

谢谢!

(Twitter API 可以在http://apiwiki.twitter.com/REST%20API%20Documentation找到)

此外,我希望能够通过搜索公共时间线来实现该算法 - http://twitter.com/statuses/public_timeline.rss

4

2 回答 2

13

Twitter 的趋势算法不仅仅是关键词的数量。这是其中的一部分,但还有一个衰减因素,因此“贾斯汀·比伯”不会永远成为热门话题。

quora 上的这篇文章支持了这一点。http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

衰减通常是通过在算法中使用帖子的相对年龄来完成的,给新的主题/帖子/等更多的权重。

另请参阅http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-流?q=趋势+算法

于 2011-01-19T17:04:36.550 回答
1

所以 Twitter 可能做的是计算特定术语的提及次数减去停用词(停用词,如:do、me、you、i、not、on 等)所以“猫不在袋子里”和“我的dog ate my cat”意味着 cat ,dog 和 bag 将是它提取的术语(其余都是停用词)然后它将 'cat' 计为 2 个引用,因此在这种情况下 'cat' 将是一个热门话题.

于 2009-11-03T09:36:54.567 回答