我有一个脚本,它使用twitter 流 api将一个短语(例如“python”)的传入推文存储到数据库表“A”中。稍后,另一个脚本使用twitter search api搜索相同的短语并将结果存储到表“B”中。我的问题是为什么“A”中有一些推文不在“B”中,反之亦然。
我可以想到在“B”而不是“A”中有推文的一个原因:
“A”仅包含在流 api 启动后发布的推文,而搜索 api 返回上周的结果。如果流 api 已经运行了一个多星期,那么“B”中不能有任何不在“A”中的推文。
我知道在“A”而不是“B”中有一些推文的两个原因:
- search API 仅返回上周的结果,而流 api 返回所有内容
- search API 只返回部分结果,而不是全部,因为它的重点不在于完整性。
我想确定我是否正确。