我是 Pentaho 和 HBase 的新手。我想从 Hbase 表中读取所有列并使用 Pentaho 将其加载到平面文件中。
一件主要的事情是,我的 Hbase 表中的列不是静态的。有些日子我会得到 30+ 列,有些日子可能会变成 50+。
我尝试在 PDI 中使用“Hbase 输入”。但我无法定义列数。有没有办法在 Pentaho 中定义动态变化的列?
不要提及任何列名。如果未提及列名,则考虑所有必填列。
第 1 步:在 HBase 输入步骤中,在“创建/编辑映射”选项卡下,调用所需的 Hbase 表名称并为该表创建一个新的映射名称。
第 2 步:然后单击“创建元组模板”。将生成 5 列。
第 3 步:单击“保存映射”并移动上一个选项卡“配置查询”。
第 4 步:单击“获取映射表名称”并选择您在“创建/编辑映射”选项卡下调用的同一个表。就像通过单击“获取指定表的映射”来调用映射名称一样。
第 5 步:单击“获取键/字段信息”。您将获得 5 列。
第 6 步:现在只保留三个必需的列(键、列、值)。
现在,您的 Pentaho 作业已准备好获取所需操作的列。