我的目标是检索来自某些小国家(如爱尔兰、新西兰、立陶宛等)的所有推文,或尽可能大比例的推文。
Twitter 的搜索 API 允许在给定纬度/经度周围的半径内搜索状态。Twitter 通过用户个人资料中包含的地理标记数据或通过对用户个人资料中的家乡位置进行反向地理编码来决定返回哪些结果。
Streaming API 中的公共状态流可以通过 geobox 过滤,但 Twitter 在返回这些结果时不会执行反向地理编码。迄今为止的研究表明,这些国家根本没有多少人使用地理标记。
显然,如果我可以访问 firehose 流,那么使用 Streaming API 将是可行的方法,因为我可以自己执行反向地理编码。然而,在默认访问级别,随机样本流没有为我提供足够的相关用户。
那么,如果我能从使用 Streaming API 中获得什么好处呢?我是否应该坚持使用 Search API,因为我不太可能从 Streaming API 获得任何独特的数据?