1

我正在尝试为 uni 项目的一部分撰写 Twitter4J 的文章,但我对一些事情感到困惑。来自 Twitter4J api:

void sample()
开始监听所有公共状态的随机样本。默认访问级别提供了 Firehose 的一小部分。“Gardenhose”访问级别提供了一个更适合数据挖掘和研究应用程序的比例,这些应用程序希望更大比例成为具有统计意义的样本。

这意味着默认情况下,为流提供“默认访问”,但可以使用另一种类型的访问,“Gardenhose 访问”。这个对吗?如果是这样,您如何访问更高的 Gardenhose 通道?

我在问,因为我在 SO 上看到了一些答案,表明只有一个级别的访问权限——Gardenhose,我正试图一劳永逸地解决这个问题。

除此之外,我想参考(如果可能的话)样本流允许访问的推文数量。我读过很多人引用 1% 的“默认访问”和 10% 的“花园软管访问”——但我在 API 的任何地方都找不到。

所以总结一下,有两个问题:

  1. 样本流是否具有“默认访问”和“花园软管访问”,或者只是其中之一?
  2. 这些访问级别可以获得多少 Twitter firehose 流?

如果回复,请尽可能提供指向可参考 API 的链接。

4

1 回答 1

1

Gardenhose 与默认示例流不同,您必须从 Twitter 请求访问才能使用它。

但是,我不确定 Twitter 是否仍然允许访问花园软管,或者即使它仍然存在。似乎当前的机制可能是使用 Twitter 的首选数据合作伙伴之一:

使用流媒体 API?

每个 Twitter 帐户都可以连接到 Streaming API 的小样本。出于数据收集或分析原因需要增加访问权限的帐户应查看我们的首选合作伙伴页面。

来源

对于学生或教育机构来说可能会有所不同,并且您仍然可以使用花园软管。以前您必须发送电子邮件api-research@twitter.com或使用以下表格,但我不知道这些方法是否仍然有效 - 帖子已经很旧了。

至于默认示例流允许访问的推文百分比,我能找到的最佳参考是 Twitter 员工在开发者论坛上发表的评论 - 强调我的:

我建议只使用来自https://stream.twitter.com/1/statuses/sample.json的1% 示例流,您可以使用您的 Twitter 帐户连接到该示例流。您不太可能处于可以访问所有数据并且必须使用样本的情况。每天大约有 2.3 亿条推文,理论上你每天仍然会收到 230 万条推文。

来源

虽然,这又是一个旧帖子。

关于 firehose 流,如文档所述,您需要被授予访问它的权限,我相信很少有人可以完全访问此流:

GET statuses/firehose

此端点需要特殊权限才能访问。

返回所有公共状态。很少有应用程序需要这种访问级别。创造性地使用其他资源和各种访问级别的组合可以满足几乎所有应用程序用例。

关于不同访问级别及其提供的内容的总体文档很少,我建议直接联系 Twitter 讨论您的要求或联系他们的数据合作伙伴之一。

抱歉,如果这不像您希望的那样具体,祝您研究顺利。

于 2013-08-29T12:13:47.943 回答