2

flume用来导入推特数据。我在我的conf
中添加了以下行:flume

TwitterAgent.sources.Twitter.keywords = hadoop, big data, analytics, bigdata, cloudera, data science, data scientiest, business intelligence, mapreduce, data warehouse, data warehousing, mahout, hbase, nosql, newsql, businessintelligence, cloudcomputing

flume忽略这条线!
Flume始终从 twitter 导入所有数据,未指定并通过我们的关键字过滤。

我怎样才能让过滤工作?

4

1 回答 1

0

按照这个链接:https ://github.com/cloudera/cdh-twitter-example/tree/master/flume-sources

使用这个类:

com.cloudera.flume.source.TwitterSource

顺便说一下,重新编译 JAR,不要使用预编译版本 :)

编辑:要重新编译,请按照链接的第 1 部分进行操作:

要从 git 存储库的根目录构建 flume-sources JAR:

 cd flume-sources  
 mvn package
 cd ..  

这将在目标目录中生成一个名为 flume-sources-1.0-SNAPSHOT.jar 的文件。

于 2014-06-17T05:54:33.387 回答