0

尝试使用 XML 输入步骤将 XML 文件获取到 Hive。我的 XML 文件如下所示:

    <breakfast_menu>
     <food>
     <name>Belgian Waffles</name>
     <price>$5.95</price>
     <description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
     <calories>650</calories>
     </food>
     <food>
     <name>Strawberry Belgian Waffles</name>
     <price>$7.95</price>
     <description>Light Belgian waffles covered with strawberries and whipped cream</description>
     <calories>900</calories>
     </food>
     </breakfast_menu>

我希望名称、价格、描述、卡路里在 Hive 表中显示为列。通过双击 XML 输入步骤,将出现配置对话框。在那里面:

  1. 在“文件”选项卡中,我指定了 XML 文件在我的系统上的位置。

  2. 在“内容”选项卡中,我将元素位置指定为早餐菜单、食物。

  3. 在“字段”选项卡中,当我单击“获取字段”时,XML 文件中的每个值都被选为一个字段。例子:

E=breakfast_menu/1,E=food/1,E=name/1

E=breakfast_menu/1,E=food/1,E=price/1

E=breakfast_menu/1,E=food/1,E=description/1

E=breakfast_menu/1,E=食物/1,E=卡路里/1

E=breakfast_menu/1,E=food/2,E=name/1 等等...

现在,在单击预览行时,它说没有找到要预览的行。所以想看看 Pentaho 如何从 XML 文件中生成模式并对其进行操作(如果需要)。

我也尝试过使用 XML STAX 输入步骤。其中,预览有两列。在一列中列出了 XML 文件的元素,在第二列中列出了它的值。我不想要那样的。不知道如何使用元素并获得所需的字段。

4

0 回答 0