我是韩国的大学生,我正在与我的顾问教授一起使用 Twitter 的大数据开发分析应用程序。所以我正在收集包含特定关键字(相关犯罪词)的推文。我现在使用'streaming api'和'search api'。我已经看到使用搜索 api 和流式 api 结果是只返回一周的推文。
我应该得到具有犯罪关键字的旧数据,并且从 2006 年到 2016 年
你有什么主意吗?
我是韩国的大学生,我正在与我的顾问教授一起使用 Twitter 的大数据开发分析应用程序。所以我正在收集包含特定关键字(相关犯罪词)的推文。我现在使用'streaming api'和'search api'。我已经看到使用搜索 api 和流式 api 结果是只返回一周的推文。
我应该得到具有犯罪关键字的旧数据,并且从 2006 年到 2016 年
你有什么主意吗?
遗憾的是,您无法在该时间范围内收到推文。从文档:
Search API 不是所有推文的完整索引,而是最近推文的索引。目前,该索引包括 6-9 天的推文。
因此,您只能从搜索 API 获取最近的推文。对数据也要小心,因为它是关于相关性而不是完整性,来自同一个文档:
在参与之前,重要的是要知道 Search API 关注的是相关性而不是完整性。这意味着搜索结果中可能会丢失一些推文和用户。如果您想匹配完整性,您应该考虑使用 Streaming API。
如果您真的需要较旧的推文,则必须从Gnip等其他来源获取它们。否则,您将不得不以不同的方式处理您的问题。
如果您拥有想要获取信息的所有用户的姓名(或 ID),则可以从每个用户那里获得最多 3200 条推文的时间线。