我正在使用 twitter4j 库来访问公共 twitter 流。我正在尝试制作一个涉及地理标记推文的项目,我需要收集大量推文进行测试。
现在我正在从 twitter 获取未经过滤的流,并且只保存带有地理标签的推文。不过这很慢,因为绝大多数推文都没有地理标签。我希望 Twitter 流只向我发送带有地理标签的推文。
我曾尝试使用此问题中提到的方法,您使用大小为 360* x 180* 的边界框进行过滤,但这对我不起作用。使用该过滤器时我没有收到任何错误,但我仍然收到 99% 的没有地理标签的推文。这是我的做法:
ConfigurationBuilder cb = new ConfigurationBuilder();
cb.setDebugEnabled(true)
.setOAuthConsumerKey("censored")
.setOAuthConsumerSecret("censored")
.setOAuthAccessToken("censored")
.setOAuthAccessTokenSecret("censored");
TwitterStream twitterStream = newTwitterStreamFactory(cb.build()).getInstance();
StatusListener listener = new MyStatusListener();
twitterStream.addListener(listener);
//add location filter for what I hope is the whole planet. Just trying to limit
//results to only things that are geotagged
FilterQuery locationFilter = new FilterQuery();
double[][] locations = {{-180.0d,-90.0d},{180.0d,90.0d}};
locationFilter.locations(locations);
twitterStream.filter(locationFilter);
twitterStream.sample();
关于为什么我仍然收到没有地理标签的推文有什么建议吗?
编辑:我刚刚重读了twitter4j javadoc关于向 twitter 流添加过滤器,它说“默认访问级别允许多达 200 个跟踪关键字、400 个关注用户 ID 和 10 个 1 度位置框。” 那么边界框可能只有 1 度宽?这与我遇到的原始信息不同。那是我的问题吗?我的过滤器请求太大所以被忽略了?尝试使用它时我没有收到任何错误。