簡體   English   中英

非常奇怪的XML異常解析

[英]Very Weird Parsing of unusual xml

我在使用XMLMappable時遇到問題。 這可能是飛行員錯誤,但3天后我還沒有找到它。 我已經查看了#xmlmapper的問題/解答,但沒有找到任何與此相關的內容。 這個問題如何訪問大子元素? 看起來很有希望,但我認為這不是同一問題。 如果我錯了,請糾正我。

我已經使用XMLMappable編寫了XMLParser。 我以較小的增量構建了它,直到最后一個解析器(Src)都運行良好。 解析器不使用xsd,但是預定義的xsd如下所示:

<xs:complexType name="srcCT" mixed="true">
    <xs:choice maxOccurs="unbounded" minOccurs="0">
        <xs:element name="w" type="wCT"/>
    </xs:choice>
</xs:complexType>

這意味着,如果存在src標記,則可以有0個或多個innerText與aw標記交替顯示,例如:

    <src> text <w> wtext </w> more text <w> another w tag </w>...</src>

問題在於解析器結果隨處可見,哪些組合有效,哪些無效。

因此,使用示例解析器創建了我的測試和測試數據,並將其添加到此處。 請原諒丑陋的印刷行:

import Foundation
import XMLMapper


class TestParser : XMLMappable
{
    var nodeName: String!

    var entries: [Entry]?

    required init ( map: XMLMap )
    {
    }

    func mapping ( map: XMLMap )
    {
        entries <- map ["entry"]
    }
}





class Entry: XMLMappable
{
    var nodeName: String!

    var id : String?
    var lang : String?
    var word : W?
    var source : Src?

    var teststring : String?

    required init ( map: XMLMap )
    {
    }

    func mapping ( map: XMLMap )
    {
        var raw : String?
        raw  <- map.attributes [ "id" ]
        guard raw != nil else { return }

        teststring <- map ["testString"]
        if teststring != nil
        {
            print ( "teststring = " + teststring! )
        }

        lang = String ( raw?.prefix ( 1 ) ?? "q" )
        id = String ( (raw?.dropFirst ( 1 ))!)
        print ( "************************** \n entry id = " + raw! )

        word <- map ["w"]
        source <- map ["src"]

        print ( "word = "  + (word?.word)! )
    }
}


class W: XMLMappable
{
    var nodeName: String!
    var word : String?
    var lang : String?
    var src : String?

    required init ( map: XMLMap )
    {
    }

    func mapping ( map: XMLMap )
    {
        lang <- map ["_xml:lang"]
        src <- map [ "_src"]
        word <- map.innerText
    }
}


//  The P R O B L E M  Child
class Src: XMLMappable
{
    var nodeName: String!
    var srctext : String?
    var references : [W]? = [W] ()


    required init ( map: XMLMap )
    {
    }

    func mapping ( map: XMLMap )
    {
        srctext <- map.innerText
        if srctext == nil
        {
            srctext = "???"
        }
        var word : W?
        word <- map ["w"]
        guard word != nil else { return }
        references?.append ( word! )

        print ( "source.w.reference = " + word!.word! )
        print ( "source .srctext = " + (srctext!) )

    }
}

==========測試數據:

<?xml version="1.0" encoding="utf-8"?>
    <lexicon >
    <entry id="Q1a">
        <testString>Test string Q1</testString>
        <w xml:lang="eng">q1</w>
        <src>src parser never called for this entry</src>
    </entry>
    <entry id="Q2">
        <w xml:lang="eng">q2</w>
        <src>this doesn't (map.innerText returns nil and i change to ???) <w src="Q2a">This works (2a)</w>; never reached </src>
    </entry>
    <entry id="Q3">
        <w xml:lang="eng">q3</w>
        <src>map.innerText returns nil <w src="3">This does not work (3)</w>; never reached <w src="Q3a">never reached</w></src>
    </entry>
    <entry id="Q4">
        <w xml:lang="eng">q4</w>
        <src>map.innerText returns nil <w src="q4a">This Works: 4a</w>;</src>
    </entry>
    <entry id="Q5">
        <w xml:lang="eng">q5</w>
        <src>This works <w src="Q5a">and so does this: 5a</w></src>
    </entry>
</lexicon>

==============

和輸出:

teststring = Test string Q1
************************** 
entry id = Q1a
word = q1
************************** 
entry id = Q2
source.w.reference = This works (2a)
source .srctext = return nil
word = q2
************************** 
entry id = Q3
word = q3
************************** 
entry id = Q4
source.w.reference = This Works: 4a
source .srctext = return nil
word = q4
************************** 
entry id = Q5
source.w.reference = and so does this: 5a
source .srctext = This works
word = q5

一般有兩個問題:1)為什么解析器有時會拾取元素,而其他時候卻沒有。 2)如何正確拾取多個內部Text和標簽。

感謝您的協助。 我真的希望有一個解決方案。

約瑟夫

您可以在XMLMapper存儲庫中引用問題

因為src元素有時具有多個文本部分(innerText),所以您必須像Array<String>一樣映射它( src內部的w元素也是如此)

因此,您可以嘗試使用以下方法替換Src類:

class Src: XMLMappable {
    var nodeName: String!

    var srctext: [String]?
    var references: [W]?

    required init(map: XMLMap) {}

    func mapping(map: XMLMap) {
        srctext <- map.innerText
        references <- map["w"]
    }
}

即使那樣,映射的值也可能不太容易閱讀。

例如,將以下元素與上述模型類映射:

<src>
    map.innerText returns nil 
    <w src="3">This does not work (3)</w>
    ; never reached 
    <w src="Q3a">never reached</w>
</src>

您最終會遇到這樣的事情:

// assuming that `source` is the variable in which you mapped the above `src` element
let source: Src = entry.source 

// the printed values are in comments 
print(source.srctext[0]) // map.innerText returns nil
print(source.srctext[1]) // ; never reached 
print(references.references[0].word) // This does not work (3)
print(references.references[1].word) // never reached

希望這可以幫助

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM