为了从 Pubmed DataSet [ncbi] 中检索数据,我使用 FireFTP 插件(在 firefox 中)检索 xml、pdf、txt 内容。[ http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/] 我已经成功安装了 Apache Flume。
主要目标是——我需要将 FTP 与 Flume 连接并将最终结果数据集存储在 Cassandra 中。
谁能帮助我如何将 FTP 源与 Flume 连接。
非常感谢你。
为此目的使用flume-ftp-source。您可以从以下链接下载源代码
https://github.com/keedio/flume-ftp-source
它是一个 Maven 项目,因此您需要构建一个 jar 才能使用它。