2

我想在 XML 文档上有一个 select 语句,并且一列应该返回 每个节点的路径

例如,给定数据

SELECT * 
FROM TABLE(XMLSequence(
  XMLTYPE('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>').extract('/*//*[text()]'))) t;

这导致

column_value
--------
<user><name>user1</name></user>
<user><name>user2</name></user>
<user><name>user3</name></user>
<user><name>user4</name></user>

我想要这样的结果:

path                     value
------------------------ --------------
/users/user/name         user1
/users/user/name         user2
/users/group/user/name   user3
/users/user/name         user4

我看不出如何做到这一点。我认为有两件事必须一起正常工作:

  • 我可以使用单个操作或方法path从一个XMLType中提取,还是必须使用字符串魔术来执行此操作?
  • 什么是正确的 XPath 表达式,这样我才能得到整个元素路径(如果可能的话),例如。<users><group><user><name>user3</name></user></group></user>而不是<user><name>user3</name></user>

也许我还没有XMLType完全理解。可能是我需要一种不同的方法,但我看不到它。

旁注:

  • 在最终版本中,XML 文档将来自表的 CLOB,而不是静态文档。
  • path列当然也可以使用点或其他任何内容,并且初始斜线不是问题,任何表示都可以。
  • 此外,我不介意每个内部节点是否也有一个结果行(可能带有nullas value),而不仅仅是其中的那些text()(这是我真正感兴趣的)。
  • 最后,我将需要单独的尾部元素path始终"name"在此处的示例中,但稍后会有所不同),即('/users/groups/user', 'name', 'user3')我可以单独处理。
4

3 回答 3

4

您可以借助Oracle XML DB XQuery 函数集中的XMLTable函数来实现:

select * from 
  XMLTable(
    '
     declare function local:path-to-node( $nodes as node()* )  as xs:string* {
       $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
     };
     for $i in $rdoc//name 
       return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>
    '
    passing 
    XMLParse(content '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>'
    )
    as "rdoc"
    columns 
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  )

对我来说,XQuery 对于 XML 数据操作至少看起来比 XSLT 更直观。

您可以在此处找到有用的 XQuery 函数集。

更新 1

我想你需要在最后阶段包含完整数据的完全简单的数据集。这个目标可以通过复杂的方式实现,在下面逐步构建,但是这个变体非常耗费资源。我建议审查最终目标(选择一些特定的记录,计算元素的数量等),然后简化这个解决方案或完全改变它。

更新 2

从此更新中删除了所有步骤,除了最后一个,因为@ABCade 在评论中提出了更优雅的解决方案。此解决方案在下面的更新 3部分中提供。

第 1 步- 构建具有相应查询结果的 id 数据集

第 2 步- 聚合到单个 XML 行

第 3 步- 最后通过使用 XMLTable 查询压缩的 XML 来获得完整的纯数据集

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all 
  select 30 id, xml_string xml_data from xmlsource 
) 
select  *
from
  XMLTable(
    '
        for $entry_user in $full_doc/full_list/list_entry/name_info
          return <tuple>
                   <id>{data($entry_user/../@id_value)}</id>
                   <path>{$entry_user/name_path/text()}</path>
                   <name>{$entry_user/name_value/text()}</name>
                  </tuple> 
    '
    passing ( 
      select  
        XMLElement("full_list", 
          XMLAgg(     
            XMLElement("list_entry",
              XMLAttributes(id as "id_value"),
              XMLQuery(
                '
                 declare function local:path-to-node( $nodes as node()* )  as xs:string* {
                   $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
                 };(: function to construct path :) 
                 for $i in $rdoc//name return <name_info><name_path>{local:path-to-node($i)}</name_path><name_value>{$i/text()}</name_value></name_info>
                '
                passing by value XMLParse(content xml_data) as "rdoc"
                returning content
              )
            )
          )
        )        
        from xml_table
    )   
    as "full_doc"      
    columns
      id_val   varchar2(4000) path '//tuple/id',
      path_val varchar2(4000) path '//tuple/path',
      name_val varchar2(4000) path '//tuple/name'
  )    

更新 3

正如@ABCade 在他的评论中提到的,有很简单的方法可以将 ID 与 XQuery 结果结合起来。

因为我不喜欢答案中的外部链接,所以下面的代码代表他的 SQL fiddle,有点适应这个答案的数据源:

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all
  select 30 id, xml_string xml_data from xmlsource
)
select xd.id, x.*  from
xml_table xd,
  XMLTable(
    'declare function local:path-to-node( $nodes as node()* )  as xs:string* {$nodes/string-join(ancestor-or-self::*/name(.), ''/'')     };     for $i in $rdoc//name        return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>    '
    passing
    XMLParse(content xd.xml_data
    )
    as "rdoc"
    columns
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  ) x
于 2013-04-09T10:26:37.787 回答
2

这并不完美,但可以作为一个开始:

这是一个sqlfiddle

with xslt as (
  select '<?xml version="1.0" ?><xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:template match="/">
  <records>
    <xsl:apply-templates/>
   </records>
  </xsl:template>
  <xsl:template match="//name">
      <columns>
        <path>
        <xsl:for-each select="ancestor-or-self::*">
            <xsl:call-template name="print-step"/>
        </xsl:for-each>
        </path>
  <value>
    <xsl:value-of select="."/>
  </value>
        <xsl:apply-templates select="*"/>
      </columns>
    </xsl:template>
    <xsl:template name="print-step">
        <xsl:text>/</xsl:text>
        <xsl:value-of select="name()"/>
        <xsl:text>[</xsl:text>
        <xsl:value-of select="1+count(preceding-sibling::*)"/>
        <xsl:text>]</xsl:text>
    </xsl:template>
   </xsl:stylesheet>'
  xsl from dual)
, xmldata as
(select xmltransform(xmltype('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>'), xmltype(xsl)) xd from xslt)

select  XT.* 
from xmldata c,
xmltable('$x//columns' passing c.xd
   as "x"
         columns
         path_c VARCHAR2(4000) PATH 'path',
         value_c VARCHAR2(4000) PATH 'value'
        ) as XT 

这就是我试图做的:

既然你想要“路径”,我不得不使用 xslt(这篇文章的学分

然后我使用xmltransform将带有 xsl 的原始 xml 转换为所需的输出(路径、值)

然后我xmltable把它当成一张桌子来读

于 2013-04-09T08:48:44.920 回答
1

这改进了 ABCade 的上述答案:

<xsl:template name="print-step">
    <xsl:variable name="name" select="name()" />
    <xsl:text>/</xsl:text>
    <xsl:value-of select="$name"/>
    <xsl:text>[</xsl:text>
    <xsl:value-of select="1+count(preceding-sibling::*[name()=$name])"/>
    <xsl:text>]</xsl:text>
</xsl:template>

结果:

/users[1]/user[1]/name[1] user1

/users[1]/user[2]/name[1] user2

/users[1]/group[1]/user[1]/name[1] user3

/users[1]/user[3]/name[1] user4

代替:

/users[1]/user[1]/name[1] user1

/users[1]/user[2]/name[1] user2

/users[1]/group[3]/user[1]/name[1] user3

/users[1]/user[4]/name[1] user4

于 2013-07-12T19:16:51.740 回答