1

我对 Pentaho 一无所知,我只想知道它是否能完成我的工作,然后再投入大量时间来学习它。

Pentaho 可以用作 XML ETL 工具吗?能否实现任意变换?一个典型的转换是将 XML 元素“Company”及其子元素“Employee”折叠到同一个“Employee”表中,但这只是最简单的转换,还有无限的其他可能性。例如,要将以下 XML 导入我们的数据库:

    <Root>
       <OrdersByCustomer>
        <CustomerInfo>
          <Customer>
            <CustomerID>1234</CustomerID>
            ...
          </Customer>
          <Address>...</Address>
        </CustomerInfo>
        <Orders>
          <Order>...</Order>
          <Order>...</Order>
          <Order>...</Order>
        </Orders>
      </ OrdersByCustomer>
    </Root>

我需要获取 CustomerID 并将其与 XML 元素“Order”中的数据一起插入。

潘塔霍能做到如此无限的任意变换吗?还是我必须削减自己的代码?

如果上述问题的答案是肯定的,那么,还有两个问题:

  1. Pentaho 是对称的和双向的吗?我们不仅需要将 XML 导入数据库,还需要从数据库中的数据生成 XML。Pentaho 能做到吗?

  2. 如果答案再次是肯定的,我知道 Pentaho 是一个框架,并且有关于它的书籍。我需要学习整个框架,还是我可以直接安装它,花半天时间只学习 XML ETL 部分,然后开始使用它?

4

1 回答 1

1
  1. 是的,Kettle/PDI 可以像导入 XML 一样轻松导出 XML。
  2. 不,您可以只使用 Kettle 的 XML 部分,它本身只是堆栈的一部分。需要明确的是——Pentaho 本身并不是一个框架,它是一个包含多个子产品的产品堆栈——你只需要查看 ETL 部分——PDI/Kettle。

水壶很容易上手,所以只需加载它,阅读许多示例中的一些,然后开始吧!

于 2012-10-24T06:07:34.523 回答