我想将 hadoop 集成到 pentaho 数据集成,我在 pentaho 网站上找到,在该网站上有用于 hadoop 的 pentaho,但它是商业的。我想让我的数据集成社区版与 hadoop 集成。我怎么能解决这个问题?
Tks
在新版本(PDI 4.2.0)中,您可以在 PDI 中看到 hadoop 组件。
访问:http: //sourceforge.net/projects/pentaho/files/Data%20Integration/
将 Kettle (ETL) 与 Hadoop 和其他各种 NoSQL 数据存储集成的最新工作可以在Pentaho Big Data Plugin中找到。这是一个 Kettle 插件,为 HDFS、MapReduce、HBase、Cassandra、MongoDB、CouchDB 提供连接器,这些连接器可以在许多 Pentaho 产品中使用:Pentaho 数据集成、Pentaho 报告和 Pentaho BA 服务器。代码托管在 Github 上:https ://github.com/pentaho/big-data-plugin 。
有一个社区登录页面,其中包含有关 Pentaho Wiki 的更多信息。您可以在此处找到 Java 开发人员的操作指南、配置选项和文档:http: //community.pentaho.com/bigdata
实际上,自从 PDI 4.3.0(昨天发布)以来,所有的 hadoop 内容现在都包含在开源版本中!所以直接去sourceforge下载吧!所有文档都在 infocenter.pentaho.com 上