2

我正在做一个需要从 twitter 获取推文和用户信息的项目。我什至无法测试当前系统,因为我一直在达到 twitter 速率限制。有什么办法吗?

我希望从每个状态中提取的基本信息是:

  • 状态文本
  • 用户关注者数量
  • 用户关注计数
  • 转推数
  • 地理位置坐标

我正在使用 Twitter4J API 来执行此操作。任何帮助将不胜感激。提前致谢。
编辑
我正在使用 twitter 的搜索 API 来获取推文列表。

4

1 回答 1

7

一种选择是使用Twitter 数据经销商(例如 GNIP)。

另一种选择是最大限度地利用 API。以下是一些提示:

  1. 检查速率限制状态,以确保您不会超过以及何时重置速率限制(当前每 15 分钟一次)。
  2. 查看参数以确保您请求计算该 API 的最大推文数。例如,计数可以默认为 20,但您可以将其设置为 200,具体取决于特定端点的可用性和限制。这可能会减少您必须进行的查询数量。
  3. 根据 Twitter 的Working with Timelines对结果进行分页指南分页您的结果。使用SinceID 和MaxID 确保您只请求新推文。这可以通过减少您需要的推文数量(通过增加保持在最大数量范围内的机会)来减少请求,并通过避免查询您已经拥有的推文来减少请求数量。
  4. 本质上,您希望从如何减少带宽和减少您必须进行的查询数量的角度来检查端点参数。
于 2013-10-02T18:47:20.717 回答