2

有谁知道我们从twitter 示例 API获得的推文数量与 Twitter 服务器接收到的推文总数之间的比率是多少?我正在根据从示例 API 读取的数据进行一些分析,并想估计 Twitter 服务器处理的实际工作量。我观察到我们从 API 获得的推文数量会随着时间而变化。所以,我认为它类似于百分比样本。任何线索都受到高度赞赏。

谢谢

4

4 回答 4

5

样本流/statuses/sample确实返回了大约 1% 的所有推文。Twitter 通过每秒仅发送 1,000 毫秒中的 10 毫秒窗口内创建的推文来对推文进行采样。如果您想了解更多详细信息,可以阅读我的博文:http: //blog.falcondai.com/2013/06/666-and-how-twitter-samples-tweets-in.html

于 2013-06-20T16:53:36.080 回答
3

Twitter Spritzer(基本上是老式的流 API)推出时,据说它约占所有推文的 1-2%。根据我对当前 Streaming API 的使用,如果它现在超过 1%,甚至可能更少,我会感到惊讶。根据文档,“ Twitter 流媒体量不是恒定的”,但他们忽略了 API 输出的量是否与实际推文的速率成正比。

于 2012-10-24T18:39:50.317 回答
2

2015 年 2 月 2 日,Twitter宣布打算将流式 API 采样率重置为 1%(它无意中爬得更高):

公共 Streaming API 示例端点(又名 POST 状态/过滤器和 GET 状态/示例)旨在随时调整为公共推文量的大约 1%。

由于过去的一些配置不一致,有时通过 Streaming API 传递的推文量可能超过了这些参数。

该通知旨在表明,在接下来的几周内,我们将对公共 Streaming API 进行更改,以重新平衡推文的数量,使其达到预期的 1% 容量。

该图显示了重置对典型推文流的影响。

于 2015-09-07T15:52:01.370 回答
0

这是我在 https://brightplanet.com/2013/06/25/twitter-firehose-vs-twitter-api-whats-the-difference-and-why-should-you-care/找到的。希望这个对你有帮助。

研究估计,使用 Twitter 的 Streaming API 的用户可以期望近乎实时地接收从 1% 到 40% 以上的推文。

网页底部有他们引用的研究的参考资料。

于 2019-06-12T04:45:39.913 回答