0

我是韩国的大学生,我正在与我的顾问教授一起使用 Twitter 的大数据开发分析应用程序。所以我正在收集包含特定关键字(相关犯罪词)的推文。我现在使用'streaming api'和'search api'。我已经看到使用搜索 api 和流式 api 结果是只返回一周的推文。

我应该得到具有犯罪关键字的旧数据,并且从 2006 年到 2016 年

你有什么主意吗?

4

1 回答 1

1

遗憾的是,您无法在该时间范围内收到推文。从文档

Search API 不是所有推文的完整索引,而是最近推文的索引。目前,该索引包括 6-9 天的推文。

因此,您只能从搜索 API 获取最近的推文。对数据也要小心,因为它是关于相关性而不是完整性,来自同一个文档:

在参与之前,重要的是要知道 Search API 关注的是相关性而不是完整性。这意味着搜索结果中可能会丢失一些推文和用户。如果您想匹配完整性,您应该考虑使用 Streaming API。

如果您真的需要较旧的推文,则必须从Gnip等其他来源获取它们。否则,您将不得不以不同的方式处理您的问题。

如果您拥有想要获取信息的所有用户的姓名(或 ID),则可以从每个用户那里获得最多 3200 条推文的时间线。

于 2016-10-05T20:38:46.917 回答