-1

为了从 Pubmed DataSet [ncbi] 中检索数据,我使用 FireFTP 插件(在 firefox 中)检索 xml、pdf、txt 内容。[ http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/] 我已经成功安装了 Apache Flume。

主要目标是——我需要将 FTP 与 Flume 连接并将最终结果数据集存储在 Cassandra 中。

谁能帮助我如何将 FTP 源与 Flume 连接。

非常感谢你。

4

1 回答 1

1

为此目的使用flume-ftp-source。您可以从以下链接下载源代码

https://github.com/keedio/flume-ftp-source

它是一个 Maven 项目,因此您需要构建一个 jar 才能使用它。

于 2015-10-07T18:32:42.503 回答