我尝试创建一个配置单元外部表:
创建外部表 TestXML(storexml 字符串)存储为 TEXTFILE LOCATION 'wasb:///test/';
但是,当我尝试执行如下查询时,它无法提取字段: SELECT xpath_string (storexml, '/trades/trade/USI')
FROM TestXML;
我看到了一篇文章,谈到了指定输入格式。添加 JARS <> 设置 xmlinput.element=Store; 创建外部表 EventStoreXML(storexml 字符串)存储为 INPUTFORMAT 'msdn.hadoop.mapreduce.input.XmlElementStreamingInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION 'wasb:///eventstore@tradedata.blob .core.windows.net/';
我无法确定添加 JAR 语句中要包含哪些 jar。我在 Linux 上使用 HDInsight。
任何指针将不胜感激。-马杜