簡體   English   中英

XSLT 1.0鍵比較多個鍵

[英]XSLT 1.0 keys compare multiple keys

在此先感謝您抽出寶貴的時間閱讀本文。

我有一個看起來像輸入XML

<data>
<row>
    <Field1>ABC</Field1>
    <Field2>123</Field2>
    <tag3>BLAH</tag3>
    <tag4>BLAH1</tag4>
</row>
<row>
    <Field1>ABC</Field1>
    <Field2>789</Field2>
    <tag3>BLAH</tag3>
    <tag4>BLAH1</tag4>
</row>
<row>
    <Field1>DEF</Field1>
    <Field2>456</Field2>
    <tag3>BLAH3</tag3>
    <tag4>BLAH4</tag4>
</row>
<row>
    <Field1>456</Field1>
    <Field2>XYZ</Field2>
    <tag3>BLAH5</tag3>
    <tag4>BLAH6</tag4>
</row>

現在我有兩個這樣定義的鍵

<xsl:key name="Field1Key" match="data/row/Field1/text()" use="."/>
<xsl:key name="Field2Key" match="data/row/Field2/text()" use="."/>

我在用鍵做的是遍歷Field1和Field2的唯一值是

<xsl:for-each select="data/row/Field1/text()[generate-id() = generate-id(key('Field1Key',.)[1])]">
    <test>
        <xsl:value-of select="."/>      
    </test>
</xsl:for-each>

<xsl:for-each select="data/row/Field2/text()[generate-id() = generate-id(key('Field2Key',.)[1])]">
    <test>
        <xsl:value-of select="."/>      
    </test>
</xsl:for-each>

這給我的輸出看起來像

<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>456</test>
<test>XYZ</test>

所以我的問題是

如何避免456值出現兩次? 當我在輸入中處理大量數據時,能否請您指出我實現這一目標的最有效方法?

非常感謝你。

嘗試這種方式:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="utf-8" indent="yes"/>

<xsl:key name="Field1or2Key" match="Field1 | Field2" use="."/>

<xsl:template match="/data">
    <output>
        <xsl:for-each select="(row/Field1 | row/Field2)[generate-id() = generate-id(key('Field1or2Key', .)[1])]">
            <test>
                <xsl:value-of select="."/>      
            </test>
        </xsl:for-each>
    </output>
</xsl:template>

</xsl:stylesheet>

請注意,節點的順序不同。 如果這很重要,請使用xsl:sort獲取所需的順序。


添加:

正如Dimitre Novatchev指出的那樣,如果輸入量很大,排序可能不是您的最佳解決方案。 我懷疑順序實際上並不重要,所以我不會發布替代解決方案(這將更加復雜)。

所以我的問題是

如何避免456值出現兩次?

這是產生所需結果而不改變結果元素序列的預期順序簡單方法

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:key name="kF1" match="Field1" use="."/>
 <xsl:key name="kF2" match="Field2" use="."/>

 <xsl:template match="/*">
   <xsl:apply-templates select="row/Field1[generate-id() = generate-id(key('kF1',.)[1])]"/>
   <xsl:apply-templates select=
       "row/Field2[generate-id() = generate-id(key('kF2',.)[1])
      and
        not(key('kF1', .))]"/>
 </xsl:template>

  <xsl:template match="Field1 | Field2">
    <test><xsl:value-of select="."/></test>
  </xsl:template>
</xsl:stylesheet>

在提供的源XML文檔上應用此轉換時:

<data>
    <row>
        <Field1>ABC</Field1>
        <Field2>123</Field2>
        <tag3>BLAH</tag3>
        <tag4>BLAH1</tag4>
    </row>
    <row>
        <Field1>ABC</Field1>
        <Field2>789</Field2>
        <tag3>BLAH</tag3>
        <tag4>BLAH1</tag4>
    </row>
    <row>
        <Field1>DEF</Field1>
        <Field2>456</Field2>
        <tag3>BLAH3</tag3>
        <tag4>BLAH4</tag4>
    </row>
    <row>
        <Field1>456</Field1>
        <Field2>XYZ</Field2>
        <tag3>BLAH5</tag3>
        <tag4>BLAH6</tag4>
    </row>
</data>

產生想要的正確結果

<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>XYZ</test>

當我在輸入中處理大量數據時,能否請您指出我實現這一目標的最有效方法?

如果執行其他人建議的排序,則為O(N*Log(N)) ,其中N是源XML文檔中元素Field1Field2的唯一字符串值的數量。

上面的解決方案不做任何排序,附加的not(key('kF1', .))]僅為O(M) ,其中M是源XML文檔的Field2元素的唯一字符串值的數量。

因此,此解決方案比使用排序來重新建立原始順序更有效 -尤其是在“輸入中有大量數據”的情況下。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM