我目前正在试验 Twitter Streaming API。一切正常,但 API 向我发送了大量数据,而我并不需要这些数据。是否有可能过滤 API 发送给我的数据?
我正在使用以下流:https ://stream.twitter.com/1.1/statuses/filter.json
我目前正在试验 Twitter Streaming API。一切正常,但 API 向我发送了大量数据,而我并不需要这些数据。是否有可能过滤 API 发送给我的数据?
我正在使用以下流:https ://stream.twitter.com/1.1/statuses/filter.json
看一下api的过滤流:
您可以输入一组关键字作为过滤器来跟踪 twitter,根据当前的限制,您最多可以跟踪 400 个关键字。
检索推文后,您必须再次进行手动过滤以删除嘈杂的数据。
因此,如果您可以通过一组关键字指定您要查找的内容,您将实现您想要的;但是您的数据中总会有噪音,因为几乎不可能通过简单的关键字过滤来精确定义 smtg。
例如,假设您想要跟踪与名为 XYZ 的品牌相关的所有推文。要获取有关品牌的推文,XYZ
您可能有一个仅包含“XYZ”的单词关键字集。API 会将所有包含的推文提供XYZ
给您,但假设“XYZ”在某种语言中具有含义,并且说该语言的人会发布关于该词的推文,您也会收到。还假设有一个名为 XYZ 的城市,人们会发送登记信息。因此,此时您需要通过语言检测或上下文信息检索过滤掉与您的主题无关的推文。但关键是指定您要涵盖的主题的关键字集。
干杯。
对于“有没有办法(除了我自己手动搜索)来检测推文对应于我在过滤器中指定的三个关键字中的哪一个?”的问题的答案是“否”?我们必须手动完成..
看看backtypestorm 项目。有使用 twitter4j 过滤 api 的示例。