我正在尝试收集有关收集推文并将其存储在database
. 我一直在查看Twitter Streaming API
并查看一个名为的界面,该界面Phirehose
似乎能够以一种易于设置的方式访问此 Stream 并收集数据。
我只是想知道这是否是唯一的方法?或者,如果有人可能会推荐一种更好的方法来做到这一点?
对于这个问题的广泛性,我深表歉意,但我只是想获得一些可能为我指明正确方向的信息。
我正在尝试收集有关收集推文并将其存储在database
. 我一直在查看Twitter Streaming API
并查看一个名为的界面,该界面Phirehose
似乎能够以一种易于设置的方式访问此 Stream 并收集数据。
我只是想知道这是否是唯一的方法?或者,如果有人可能会推荐一种更好的方法来做到这一点?
对于这个问题的广泛性,我深表歉意,但我只是想获得一些可能为我指明正确方向的信息。
Phirehose专为您描述的用例而设计:它负责连接(并且还负责在您的重新连接失败时进行回退之类的事情)。
你提到只对某个地理区域感兴趣。使用 PhirehosesetLocation()
来做到这一点。请参阅 phirehose 示例目录中的 filter-track-geo.php 了解如何执行此操作。(但请注意,您会错过住在您隔壁但决定不在推文中提供其位置的用户的推文。)
另一种方法是不使用流式 API并使用标准REST API进行轮询。据我所知,流式 API 没有提供任何东西,但延迟和开销更大。