尝试使用 XML 输入步骤将 XML 文件获取到 Hive。我的 XML 文件如下所示:
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
<calories>650</calories>
</food>
<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>Light Belgian waffles covered with strawberries and whipped cream</description>
<calories>900</calories>
</food>
</breakfast_menu>
我希望名称、价格、描述、卡路里在 Hive 表中显示为列。通过双击 XML 输入步骤,将出现配置对话框。在那里面:
在“文件”选项卡中,我指定了 XML 文件在我的系统上的位置。
在“内容”选项卡中,我将元素位置指定为早餐菜单、食物。
在“字段”选项卡中,当我单击“获取字段”时,XML 文件中的每个值都被选为一个字段。例子:
E=breakfast_menu/1,E=food/1,E=name/1
E=breakfast_menu/1,E=food/1,E=price/1
E=breakfast_menu/1,E=food/1,E=description/1
E=breakfast_menu/1,E=食物/1,E=卡路里/1
E=breakfast_menu/1,E=food/2,E=name/1 等等...
现在,在单击预览行时,它说没有找到要预览的行。所以想看看 Pentaho 如何从 XML 文件中生成模式并对其进行操作(如果需要)。
我也尝试过使用 XML STAX 输入步骤。其中,预览有两列。在一列中列出了 XML 文件的元素,在第二列中列出了它的值。我不想要那样的。不知道如何使用元素并获得所需的字段。