1

我正在尝试收集有关收集推文并将其存储在database. 我一直在查看Twitter Streaming API并查看一个名为的界面,该界面Phirehose似乎能够以一种易于设置的方式访问此 Stream 并收集数据。

我只是想知道这是否是唯一的方法?或者,如果有人可能会推荐一种更好的方法来做到这一点?

对于这个问题的广泛性,我深表歉意,但我只是想获得一些可能为我指明正确方向的信息。

4

2 回答 2

2

Phirehose专为您描述的用例而设计:它负责连接(并且还负责在您的重新连接失败时进行回退之类的事情)。

你提到只对某个地理区域感兴趣。使用 PhirehosesetLocation()来做到这一点。请参阅 phirehose 示例目录中的 filter-track-geo.php 了解如何执行此操作。(但请注意,您会错过住在您隔壁但决定不在推文中提供其位置的用户的推文。)

另一种方法是不使用流式 API并使用标准REST API进行轮询。据我所知,流式 API 没有提供任何东西,但延迟和开销更大。

于 2014-08-20T15:39:43.347 回答
1

Firehouse API 将返回所有公共推文——这对于大多数应用程序来说可能需要处理很多(而且可能也无法免费访问)。但是,您可以使用 Sample API 每分钟提供 3000 条示例推文。见这里

此(或任何其他 Twitter API)作为 REST API 提供。您可以创建自己的代码来读取 API,也可以使用已经存在的众多库之一。有关库列表,请参见此处

问候,丹尼尔

于 2014-08-19T20:10:16.497 回答