簡體   English   中英

如何使用 XSLT 1.0 將 Excel 轉換為帶有嵌套元素的 XML?

[英]How to convert Excel to XML with nested elements using XSLT 1.0?

我正在嘗試將從 Excel 導出的 XML 結構轉換為具有嵌套元素的新結構。 我很難弄清楚如何使用 XSLT v1.0 做到這一點。

我的目標是將行數據放入結果 xml 的所需級別。 因此,如果一行僅包含 1 個包含數據的單元格,則它是一個類別,例如:

<projects> 
<category name="001">
...
</category>
</projects>

如果一行有 2 個數據單元格,則它代表一個區域,應該是 previos 類別的子級。

<projects> 
<category name="001">
<region name="AAA">...</region>
<region name="BBB">...</region>
</category>
</projects>

如果該行有 3 或 4 個包含數據的單元格,則它表示一個帳戶,該帳戶應該是前一個區域的子級。

<projects> 
<category name="001">
<region name="AAA">
<account name="lorem">...</account>
<account name="ipsum">...</account>
</region>
<region name="BBB">...</region>
...
</category>
</projects>

好的,到目前為止我所擁有的:這是來自 Excel 的 XML 文件。 它具有簡單的結構,具有重復的行元素。 每行包含 5 個單元格,但並非每個單元格都始終包含一個 Data 元素。 我試圖用它來確定每行代表什么樣的信息。

    <Table ss:ExpandedColumnCount="6" ss:ExpandedRowCount="69" x:FullColumns="1"    x:FullRows="1" ss:StyleID="s62" ss:DefaultColumnWidth="69">
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"/>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s68"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="15">
    <Cell ss:Index="2" ss:StyleID="s70"><Data ss:Type="String">Categorie 004</Data></Cell>
    <Cell ss:StyleID="s71"/>
    <Cell ss:StyleID="s70"/>
    <Cell ss:StyleID="s72"/>
    <Cell ss:StyleID="s70"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">AAA</Data></Cell>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s69"><Data ss:Type="String">X</Data></Cell>
    <Cell ss:StyleID="s73"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.01</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"/>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s73"/>
    <Cell ss:StyleID="s68"/>
   </Row>
   <Row ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"/>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s73"/>
    <Cell ss:StyleID="s68"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"/>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s73"/>
    <Cell ss:StyleID="s68"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="15">
    <Cell ss:Index="2" ss:StyleID="s70"><Data ss:Type="String">Categorie 001</Data></Cell>
    <Cell ss:StyleID="s71"/>
    <Cell ss:StyleID="s70"/>
    <Cell ss:StyleID="s72"/>
    <Cell ss:StyleID="s70"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s82"><Data ss:Type="String">AAA</Data></Cell>
    <Cell ss:StyleID="s83"/>
    <Cell ss:StyleID="s82"/>
    <Cell ss:StyleID="s84"/>
    <Cell ss:StyleID="s85"><Data ss:Type="Number">3.0800000000000001E-2</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">dolor</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">123</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">A</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.01</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="15">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">sit amet</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">445</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">B</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.03</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">consetetur</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">36</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">B</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">8.0000000000000004E-4</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s82"><Data ss:Type="String">BBB</Data></Cell>
    <Cell ss:StyleID="s83"/>
    <Cell ss:StyleID="s82"/>
    <Cell ss:StyleID="s84"/>
    <Cell ss:StyleID="s85"><Data ss:Type="Number">0.03</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">sadipscing</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">666</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">A</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.01</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="15">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">elitr</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">97</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">C</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.02</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="15">
    <Cell ss:Index="2" ss:StyleID="s68"/>
    <Cell ss:StyleID="s69"/>
    <Cell ss:StyleID="s68"/>
    <Cell ss:StyleID="s73"/>
    <Cell ss:StyleID="s68"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s70"><Data ss:Type="String">Categorie 001</Data></Cell>
    <Cell ss:StyleID="s71"/>
    <Cell ss:StyleID="s70"/>
    <Cell ss:StyleID="s72"/>
    <Cell ss:StyleID="s70"/>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s82"><Data ss:Type="String">AAA</Data></Cell>
    <Cell ss:StyleID="s83"/>
    <Cell ss:StyleID="s82"/>
    <Cell ss:StyleID="s84"/>
    <Cell ss:StyleID="s85"><Data ss:Type="Number">0.04</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">aliquyam</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">65</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">A</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.02</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">ipsum</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">99</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">B</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.02</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s82"><Data ss:Type="String">BBB</Data></Cell>
    <Cell ss:StyleID="s83"/>
    <Cell ss:StyleID="s82"/>
    <Cell ss:StyleID="s84"/>
    <Cell ss:StyleID="s85"><Data ss:Type="Number">0.01</Data></Cell>
   </Row>
   <Row ss:AutoFitHeight="0" ss:Height="14.25">
    <Cell ss:Index="2" ss:StyleID="s68"><Data ss:Type="String">lorem</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="Number">321</Data></Cell>
    <Cell ss:StyleID="s69"><Data ss:Type="String">C</Data></Cell>
    <Cell ss:StyleID="s86"/>
    <Cell ss:StyleID="s74"><Data ss:Type="Number">0.01</Data></Cell>
   </Row>
  </Table>

到目前為止,我已經創建了以下樣式表,並且能夠根據需要過濾所有信息。

<!-- Filter Excel Cells -->
<xsl:template match="ss:Row">
    <xsl:if test="count(.//ss:Data) &gt; 0">
        <xsl:choose>
            <xsl:when test="count(.//ss:Data)=1">
                <Categorie>
                    <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                </Categorie>
            </xsl:when>
            <xsl:when test="count(.//ss:Data)=2">
                <Region>
                    <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                </Region>
            </xsl:when>
            <xsl:when test="count(.//ss:Data)=3">
                <xsl:choose>
                    <xsl:when test=".//ss:Cell[5]/ss:Data='Rating'">
                        <Header>
                            <Text1>
                                <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                            </Text1>
                            <Text2>
                                <xsl:value-of select=".//ss:Cell[3]/ss:Data"/>
                            </Text2>
                            <Text3>
                                <xsl:value-of select=".//ss:Cell[5]/ss:Data"/>
                            </Text3>
                        </Header>
                    </xsl:when>
                    <xsl:otherwise>
                        <Account>
                            <Name>
                                <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                            </Name>
                            <Value>
                                <xsl:value-of select=".//ss:Cell[3]/ss:Data"/>
                            </Value>
                            <Rating>
                                <xsl:value-of select=".//ss:Cell[5]/ss:Data"/>
                            </Rating>
                        </Account>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:when>
            <xsl:when test="count(.//ss:Data)=4">
                <xsl:choose>
                    <xsl:when test=".//ss:Cell[5]/ss:Data='Gewicht'">
                        <Header>
                            <Text1>
                                <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                            </Text1>
                            <Text2>
                                <xsl:value-of select=".//ss:Cell[2]/ss:Data"/>
                            </Text2>
                            <Text3>
                                <xsl:value-of select=".//ss:Cell[3]/ss:Data"/>
                            </Text3>
                            <Text4>
                                <xsl:value-of select=".//ss:Cell[5]/ss:Data"/>
                            </Text4>
                        </Header>
                    </xsl:when>
                    <xsl:otherwise>
                        <Account>
                            <Name>
                                <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
                            </Name>
                            <Type>
                                <xsl:value-of select=".//ss:Cell[2]/ss:Data"/>
                            </Type>
                            <Value>
                                <xsl:value-of select=".//ss:Cell[3]/ss:Data"/>
                            </Value>
                            <Rating>
                                <xsl:value-of select=".//ss:Cell[5]/ss:Data"/>
                            </Rating>
                        </Account>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:when>
        </xsl:choose>
    </xsl:if>
</xsl:template>

我的結果現在看起來是這樣的:

<?xml version="1.0" encoding="UTF-8"?>
<Projects xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet">
    <Categorie>Categorie 004</Categorie>
    <Region>AAA</Region>
    <Account>
        <Name>AAA</Name>
        <Value>X</Value>
        <Rating>0.01</Rating>
    </Account>
    <Account>
        <Name>Name</Name>
        <Type>Value</Type>
        <Value>Type</Value>
        <Rating>Rating</Rating>
    </Account>
    <Categorie>Categorie 001</Categorie>
    <Region>AAA</Region>
    <Account>
        <Name>dolor</Name>
        <Type>123</Type>
        <Value>A</Value>
        <Rating>0.01</Rating>
    </Account>
    <Account>
        <Name>sit amet</Name>
        <Type>445</Type>
        <Value>B</Value>
        <Rating>0.03</Rating>
    </Account>
    <Account>
        <Name>consetetur</Name>
        <Type>36</Type>
        <Value>B</Value>
        <Rating>8.0000000000000004E-4</Rating>
    </Account>
    <Region>BBB</Region>
    <Account>
        <Name>sadipscing</Name>
        <Type>666</Type>
        <Value>A</Value>
        <Rating>0.01</Rating>
    </Account>
    <Account>
        <Name>elitr</Name>
        <Type>97</Type>
        <Value>C</Value>
        <Rating>0.02</Rating>
    </Account>
    <Account>
        <Name>Name</Name>
        <Type>Value</Type>
        <Value>Type</Value>
        <Rating>Rating</Rating>
    </Account>
    <Categorie>Categorie 001</Categorie>
    <Region>AAA</Region>
    <Account>
        <Name>aliquyam</Name>
        <Type>65</Type>
        <Value>A</Value>
        <Rating>0.02</Rating>
    </Account>
    <Account>
        <Name>ipsum</Name>
        <Type>99</Type>
        <Value>B</Value>
        <Rating>0.02</Rating>
    </Account>
    <Region>BBB</Region>
    <Account>
        <Name>lorem</Name>
        <Type>321</Type>
        <Value>C</Value>
        <Rating>0.01</Rating>
    </Account>
</Projects>

不錯(對我來說),但我需要像這樣嵌套數據,而不是每個數據都在同一級別。 我需要你的幫助!

<?xml version="1.0" encoding="UTF-8"?>
<Projects xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet">
    <Categorie name="001"/>
        <Region name="AAA">
            <Account>
                <Name>Name</Name>
                <Type>Value</Type>
                <Value>Type</Value>
                <Rating>Rating</Rating>
            </Account>
            <Account>
                <Name>Name</Name>
                <Type>Value</Type>
                <Value>Type</Value>
                <Rating>Rating</Rating>
            </Account>
        </Region>
        <Region name="BBB">
            <Account>
                <Name>Name</Name>
                <Type>Value</Type>
                <Value>Type</Value>
                <Rating>Rating</Rating>
            </Account>
            <Account>
                <Name>Name</Name>
                <Type>Value</Type>
                <Value>Type</Value>
                <Rating>Rating</Rating>
            </Account>
            ...
        </Region>
        <Categorie name="002"/>
            <Region name="AAA">
                ...
            </Region>
        </Categorie>
</Projects>

我相信您需要在某些標簽上使用元素/屬性調用,以將它們置於您需要的格式中,如下所示

<xsl:element name="Categorie">
        <xsl:attribute name="name">
                 <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
        </xsl:attribute>
        <xsl:element name="Region">
            <xsl:attribute name="name">
                 <xsl:value-of select=".//ss:Cell[1]/ss:Data"/>
            </xsl:attribute>
          //rest of transform here
        </xsl:element>      
 </xsl:element>

我還沒有對此進行任何類型的測試,但這應該為您指明所需的方向

將一維標記轉換為層次結構是一個分組問題。 在這種情況下,一個group-starting-with問題。

在 XSLT 2.0 中

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0">
    <xsl:template match="Table">
        <xsl:for-each-group 
            select="Row[.//Data]" 
            group-starting-with="Row[count(.//Data)=1]">
            <Categorie>
                <xsl:for-each-group 
                    select="current-group()[position()>1]" 
                    group-starting-with="Row[count(.//Data)=2]">
                    <xsl:choose>
                        <xsl:when test="not(self::Row[count(.//Data)=2])">
                            <xsl:apply-templates select="current-group()"/>
                        </xsl:when>
                        <xsl:otherwise>
                            <Region>
                                <xsl:apply-templates 
                                    select="current-group()[position()>1]"/>
                            </Region>
                        </xsl:otherwise>
                    </xsl:choose>
                </xsl:for-each-group>
            </Categorie>
        </xsl:for-each-group>
    </xsl:template>

   <xsl:template match="Row">
        <Account>
            <xsl:apply-templates/>
        </Account>
    </xsl:template>

    <xsl:template match="Row[.//Cell[5]/Data[.='Rating' or .='Gewicht']]">
        <Header>
            <xsl:apply-templates/>
        </Header>
    </xsl:template>

    <xsl:template match="Data">
        <Data>
            <xsl:value-of select="."/>
        </Data>
    </xsl:template>    
</xsl:stylesheet>

輸出:

<Categorie>
   <Account>
      <Data>AAA</Data>
      <Data>X</Data>
      <Data>0.01</Data>
   </Account>
</Categorie>
<Categorie>
   <Region>
      <Account>
         <Data>dolor</Data>
         <Data>123</Data>
         <Data>A</Data>
         <Data>0.01</Data>
      </Account>
      <Account>
         <Data>sit amet</Data>
         <Data>445</Data>
         <Data>B</Data>
         <Data>0.03</Data>
      </Account>
      <Account>
         <Data>consetetur</Data>
         <Data>36</Data>
         <Data>B</Data>
         <Data>8.0000000000000004E-4</Data>
      </Account>
   </Region>
   <Region>
      <Account>
         <Data>sadipscing</Data>
         <Data>666</Data>
         <Data>A</Data>
         <Data>0.01</Data>
      </Account>
      <Account>
         <Data>elitr</Data>
         <Data>97</Data>
         <Data>C</Data>
         <Data>0.02</Data>
      </Account>
   </Region>
</Categorie>
<Categorie>
   <Region>
      <Account>
         <Data>aliquyam</Data>
         <Data>65</Data>
         <Data>A</Data>
         <Data>0.02</Data>
      </Account>
      <Account>
         <Data>ipsum</Data>
         <Data>99</Data>
         <Data>B</Data>
         <Data>0.02</Data>
      </Account>
   </Region>
   <Region>
      <Account>
         <Data>lorem</Data>
         <Data>321</Data>
         <Data>C</Data>
         <Data>0.01</Data>
      </Account>
   </Region>
</Categorie>

請注意:您的輸入缺少xss前綴的命名空間聲明(即xmlns:x="ns1" xmlns:ss="ns2" )。 此外,當使用起始模式分組時,匹配的元素是組的一部分(因此current-group()[position()>1] )並且在第一次匹配之前可能存在包含所有元素的第一組(因此xsl:choose )。 為了更好地理解主要問題,省略了Data元素的轉換。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM