0

我是 Pentaho 和 HBase 的新手。我想从 Hbase 表中读取所有列并使用 Pentaho 将其加载到平面文件中。

一件主要的事情是,我的 Hbase 表中的列不是静态的。有些日子我会得到 30+ 列,有些日子可能会变成 50+。

我尝试在 PDI 中使用“Hbase 输入”。但我无法定义列数。有没有办法在 Pentaho 中定义动态变化的列?

4

1 回答 1

0

不要提及任何列名。如果未提及列名,则考虑所有必填列。

第 1 步:在 HBase 输入步骤中,在“创建/编辑映射”选项卡下,调用所需的 Hbase 表名称并为该表创建一个新的映射名称。
第 2 步:然后单击“创建元组模板”。将生成 5 列。
第 3 步:单击“保存映射”并移动上一个选项卡“配置查询”。
第 4 步:单击“获取映射表名称”并选择您在“创建/编辑映射”选项卡下调用的同一个表。就像通过单击“获取指定表的映射”来调用映射名称一样。
第 5 步:单击“获取键/字段信息”。您将获得 5 列。
第 6 步:现在只保留三个必需的列(键、列、值)。

现在,您的 Pentaho 作业已准备好获取所需操作的列。

于 2015-09-23T11:35:39.517 回答