0

我正在考虑使用 Pentaho/Kettle 进行数据摄取。我已经遇到了问题,但我不确定这是工具的问题还是我缺乏知识。

我已经弄清楚如何创建转换并从 XML 文件中读取数据,这是我转换的第一部分。不幸的是,我的 XML 有点像这样:

<rootnode>
    <category someattribute="cool" rownum="7">
        <firstnode>some data</firstnode>
        <secondnode>more data</secondnode>
    </category>
    <category someattribute="cooler" rownum="8">
        <firstnode>some data II</firstnode>
        <secondnode>more data II</secondnode>
    </category>
</rootnode>

我正在使用从 XML 步骤中输入/获取数据,虽然我可以让它正确显示所有类别和 firstnode/secondnode 值,但我什至找不到任何方法来查看属性 rownum 和 someattribute。

Kettle 是否能够处理 XML 属性并允许您在转换步骤中使用它们?如果是这样,如何或有人可以向我展示有关该主题的文档?(我找不到任何东西)。

4

1 回答 1

2

只需将步骤设置为循环类别,然后单击获取字段。它会给你所有的属性和子节点。

一个技巧是将您的 xml 放入文件中,将 xml 输入步骤设置为从文件中读取,配置该步骤,然后恢复为从字段中读取 xml。

于 2012-04-23T06:57:21.177 回答