0

我需要获取一组给定关键字的 twitter 历史数据。Twitter 搜索 API 返回不超过 9 天的推文,因此不会这样做。我目前正在使用 Tweepy 库 (http://code.google.com/p/tweepy/) 来调用 Streaming API,它工作正常,只是它太慢了。例如,当我搜索“$GOOG”时,有时两个结果之间需要一个多小时。肯定有包含该关键字的推文,但它返回结果的速度不够快。

可能是什么问题?Streaming API 是慢还是我的访问方法有问题?有没有更好的方法可以免费获取这些数据?

4

2 回答 2

1

你需要多远?要获取历史数据,您可能希望无限期地保持流(流 API 允许这样做)并将流存储在本地,然后从您的数据库中检索历史数据。

我还使用 Tweepy 进行实时流/过滤,效果很好。延迟通常小于 1 秒,Tweepy 能够处理大容量流。

于 2011-10-03T20:14:13.863 回答
0

流 API 太快,您一发布就收到消息,我们使用 twitter4j。但是流媒体只流式传输当前消息,因此如果您在发送推文时没有收听流媒体,那么消息就会丢失。

于 2011-09-27T13:04:53.223 回答