3

我可以使用什么现成的可用算法来挖掘 twitter 数据,以找出 twitter 上 2 人之间的分离程度。

当社交图谱不断变化和更新时,它会如何变化。

然后,是否有任何我可以使用的 twitter 社交图数据转储,而不是进行如此多的 API 调用来重新开始。

4

3 回答 3

5

来自推特 API

什么是数据挖掘提要,我可以访问它吗?

数据挖掘提要是我们的 /statuses/public_timeline REST API 方法的扩展版本。它返回 600 个最近的公共状态,一次缓存一分钟。您最多可以每分钟请求一次,以获取 Twitter 上公开状态的代表性样本。我们免费向研究人员和爱好者提供此服务(并且没有服务质量保证)。我们所要求的只是您提供您的研究或项目的简要说明以及您将从其请求提要的 IP 地址;只需填写此表格。请注意,数据挖掘提要并非旨在提供 Twitter 上所有公共更新的连续流;有关即将推出的“firehose”解决方案的更多信息,请参见上文。

另请参阅:流式 API 文档

于 2009-04-24T10:43:58.203 回答
0

有一家公司提供社交图的转储,但它被删除并且不再可用。正如您已经意识到的那样 - 这有点困难,因为它一直在变化。

我建议查看他们的 social_graph api 方法,因为它们以最少的 API 调用提供最多的信息。

于 2009-05-03T16:34:30.267 回答
0

可能还有其他方法可以做到这一点,但我刚刚花了 10 分钟的时间研究做类似的事情,偶然发现了这个 Q。

我会使用无向(和加权 - 因为我也想查看位置)图 - 在 py 中使用 JgraphT 或类似的;JGraphT 是基于 java 的,但包含不同的预先编写的算法。

然后,您可以使用一种称为 BellmanFord 的算法;与 Dijkstras 不同,接受整数输入并在图形中搜索具有整数输入且仅整数输入的最短路径。

http://en.wikipedia.org/wiki/Bellman%E2%80%93Ford_algorithm

我最近在一个飞行路线项目中使用它,迭代以找到具有最短“跳数”(边缘)的最短路径。

于 2011-03-25T09:09:21.817 回答