繁体   English   中英

如何从XMLType节点中提取元素路径?

[英]How to extract element-path from XMLType Node?

我想在XML文档上有一条select语句,并且一栏应该返回我每个节点路径

例如,给定数据

SELECT * 
FROM TABLE(XMLSequence(
  XMLTYPE('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>').extract('/*//*[text()]'))) t;

结果如何

column_value
--------
<user><name>user1</name></user>
<user><name>user2</name></user>
<user><name>user3</name></user>
<user><name>user4</name></user>

我想要这样的结果:

path                     value
------------------------ --------------
/users/user/name         user1
/users/user/name         user2
/users/group/user/name   user3
/users/user/name         user4

我看不到如何做到这一点。 我认为有两件事需要妥善合作:

  • 我可以使用单个操作或方法从XMLType提取path ,还是必须用string-magic做到这一点?
  • 什么是正确的XPath表达式,以便我可以获取整个元素路径 (如果可以),例如。 <users><group><user><name>user3</name></user></group></user><user><name>user3</name></user>标签?

也许我还没有完全理解XMLType 可能我需要一种不同的方法,但我看不到它。

图片的标题说明:

  • 在最终版本中,XML文档将来自表的CLOB,而不是静态文档。
  • 当然, path列也可以使用点或其他任何东西,而初始斜杠不是问题,任何表示形式都可以。
  • 另外我不介意每个内部节点是否也得到一个结果行(可能以null作为value ),而不仅仅是带有text()的那个(这是我真正感兴趣的)。
  • 最后,我将需要pathtail元素分开(在此示例中始终为"name" ,但是稍后会有所不同),即('/users/groups/user', 'name', 'user3') ,我可以分开处理。

您可以通过Oracle XML DB XQuery函数集中XMLTable函数来实现:

select * from 
  XMLTable(
    '
     declare function local:path-to-node( $nodes as node()* )  as xs:string* {
       $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
     };
     for $i in $rdoc//name 
       return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>
    '
    passing 
    XMLParse(content '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>'
    )
    as "rdoc"
    columns 
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  )

对我来说,XQuery看起来至少比XSLT更直观的XML数据操作。

您可以在此处找到有用的XQuery函数集。

更新1

我想在最后阶段你需要完整的数据集和完整的数据。 可以通过复杂的方法来实现此目标,下面将逐步进行构造,但是此变体非常耗资源。 我建议审查最终目标(选择一些特定记录,计算元素数量等),然后简化此解决方案或完全改变它。

更新2

除最后一个步骤外,所有其他步骤均从此更新中删除,因为@ABCade在注释中提出了更优雅的解决方案。 此解决方案在下面的更新3部分中提供。

步骤1 - 使用相应的查询结果构建id的数据集

第2步 -汇总到单个XML行

步骤3-通过使用XMLTable查询约束的XML,最终获得完整的数据集

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all 
  select 30 id, xml_string xml_data from xmlsource 
) 
select  *
from
  XMLTable(
    '
        for $entry_user in $full_doc/full_list/list_entry/name_info
          return <tuple>
                   <id>{data($entry_user/../@id_value)}</id>
                   <path>{$entry_user/name_path/text()}</path>
                   <name>{$entry_user/name_value/text()}</name>
                  </tuple> 
    '
    passing ( 
      select  
        XMLElement("full_list", 
          XMLAgg(     
            XMLElement("list_entry",
              XMLAttributes(id as "id_value"),
              XMLQuery(
                '
                 declare function local:path-to-node( $nodes as node()* )  as xs:string* {
                   $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
                 };(: function to construct path :) 
                 for $i in $rdoc//name return <name_info><name_path>{local:path-to-node($i)}</name_path><name_value>{$i/text()}</name_value></name_info>
                '
                passing by value XMLParse(content xml_data) as "rdoc"
                returning content
              )
            )
          )
        )        
        from xml_table
    )   
    as "full_doc"      
    columns
      id_val   varchar2(4000) path '//tuple/id',
      path_val varchar2(4000) path '//tuple/path',
      name_val varchar2(4000) path '//tuple/name'
  )    

更新3

正如@ABCade在评论中提到的那样,有一种非常简单的方法可以将ID与XQuery结果连接在一起。

因为我不喜欢答案中的外部链接,下面的代码代表他的SQL小提琴 ,稍微适应这个答案的数据源:

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all
  select 30 id, xml_string xml_data from xmlsource
)
select xd.id, x.*  from
xml_table xd,
  XMLTable(
    'declare function local:path-to-node( $nodes as node()* )  as xs:string* {$nodes/string-join(ancestor-or-self::*/name(.), ''/'')     };     for $i in $rdoc//name        return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>    '
    passing
    XMLParse(content xd.xml_data
    )
    as "rdoc"
    columns
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  ) x

这并不完美,但可以作为一个开始:

这是一个sqlfiddle

with xslt as (
  select '<?xml version="1.0" ?><xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:template match="/">
  <records>
    <xsl:apply-templates/>
   </records>
  </xsl:template>
  <xsl:template match="//name">
      <columns>
        <path>
        <xsl:for-each select="ancestor-or-self::*">
            <xsl:call-template name="print-step"/>
        </xsl:for-each>
        </path>
  <value>
    <xsl:value-of select="."/>
  </value>
        <xsl:apply-templates select="*"/>
      </columns>
    </xsl:template>
    <xsl:template name="print-step">
        <xsl:text>/</xsl:text>
        <xsl:value-of select="name()"/>
        <xsl:text>[</xsl:text>
        <xsl:value-of select="1+count(preceding-sibling::*)"/>
        <xsl:text>]</xsl:text>
    </xsl:template>
   </xsl:stylesheet>'
  xsl from dual)
, xmldata as
(select xmltransform(xmltype('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>'), xmltype(xsl)) xd from xslt)

select  XT.* 
from xmldata c,
xmltable('$x//columns' passing c.xd
   as "x"
         columns
         path_c VARCHAR2(4000) PATH 'path',
         value_c VARCHAR2(4000) PATH 'value'
        ) as XT 

这就是我试图做的事情:

由于您要使用“路径”,因此我不得不使用xslt( 此帖子的内容

然后,我使用xmltransform将带有xsl的原始xml转换为所需的输出(路径,值)

然后我使用xmltable将其作为表读取

这是对ABCade的以上回答的改进:

<xsl:template name="print-step">
    <xsl:variable name="name" select="name()" />
    <xsl:text>/</xsl:text>
    <xsl:value-of select="$name"/>
    <xsl:text>[</xsl:text>
    <xsl:value-of select="1+count(preceding-sibling::*[name()=$name])"/>
    <xsl:text>]</xsl:text>
</xsl:template>

结果如下:

/ users [1] / user [1] / name [1] user1

/ users [1] / user [2] / name [1] user2

/ users [1] / group [1] / user [1] / name [1] user3

/ users [1] / user [3] / name [1] user4

代替:

/ users [1] / user [1] / name [1] user1

/ users [1] / user [2] / name [1] user2

/ users [1] / group [3] / user [1] / name [1] user3

/ users [1] / user [4] / name [1] user4

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM