0

我想将 hadoop 集成到 pentaho 数据集成,我在 pentaho 网站上找到,在该网站上有用于 hadoop 的 pentaho,但它是商业的。我想让我的数据集成社区版与 hadoop 集成。我怎么能解决这个问题?

Tks

4

3 回答 3

2

在新版本(PDI 4.2.0)中,您可以在 PDI 中看到 hadoop 组件。

访问:http: //sourceforge.net/projects/pentaho/files/Data%20Integration/

于 2011-09-22T14:47:57.907 回答
1

将 Kettle (ETL) 与 Hadoop 和其他各种 NoSQL 数据存储集成的最新工作可以在Pentaho Big Data Plugin中找到。这是一个 Kettle 插件,为 HDFS、MapReduce、HBase、Cassandra、MongoDB、CouchDB 提供连接器,这些连接器可以在许多 Pentaho 产品中使用:Pentaho 数据集成、Pentaho 报告和 Pentaho BA 服务器。代码托管在 Github 上:https ://github.com/pentaho/big-data-plugin 。

有一个社区登录页面,其中包含有关 Pentaho Wiki 的更多信息。您可以在此处找到 Java 开发人员的操作指南、配置选项和文档:http: //community.pentaho.com/bigdata

于 2012-07-10T12:38:38.553 回答
1

实际上,自从 PDI 4.3.0(昨天发布)以来,所有的 hadoop 内容现在都包含在开源版本中!所以直接去sourceforge下载吧!所有文档都在 infocenter.pentaho.com 上

于 2012-05-08T05:28:49.363 回答