有谁知道我们从twitter 示例 API获得的推文数量与 Twitter 服务器接收到的推文总数之间的比率是多少?我正在根据从示例 API 读取的数据进行一些分析,并想估计 Twitter 服务器处理的实际工作量。我观察到我们从 API 获得的推文数量会随着时间而变化。所以,我认为它类似于百分比样本。任何线索都受到高度赞赏。
谢谢
有谁知道我们从twitter 示例 API获得的推文数量与 Twitter 服务器接收到的推文总数之间的比率是多少?我正在根据从示例 API 读取的数据进行一些分析,并想估计 Twitter 服务器处理的实际工作量。我观察到我们从 API 获得的推文数量会随着时间而变化。所以,我认为它类似于百分比样本。任何线索都受到高度赞赏。
谢谢
样本流/statuses/sample
确实返回了大约 1% 的所有推文。Twitter 通过每秒仅发送 1,000 毫秒中的 10 毫秒窗口内创建的推文来对推文进行采样。如果您想了解更多详细信息,可以阅读我的博文:http: //blog.falcondai.com/2013/06/666-and-how-twitter-samples-tweets-in.html
当Twitter Spritzer(基本上是老式的流 API)推出时,据说它约占所有推文的 1-2%。根据我对当前 Streaming API 的使用,如果它现在超过 1%,甚至可能更少,我会感到惊讶。根据文档,“ Twitter 流媒体量不是恒定的”,但他们忽略了 API 输出的量是否与实际推文的速率成正比。
这是我在 https://brightplanet.com/2013/06/25/twitter-firehose-vs-twitter-api-whats-the-difference-and-why-should-you-care/找到的。希望这个对你有帮助。
研究估计,使用 Twitter 的 Streaming API 的用户可以期望近乎实时地接收从 1% 到 40% 以上的推文。
网页底部有他们引用的研究的参考资料。