簡體   English   中英

解析xml特殊字符問題

[英]Parsing xml special chars issue

我正在使用SAX解析從webservice獲得的XML。

字段之一是鏈接,如下所示

<link_site>
   http://www.ownhosting.com/webservice_332.asp?id_user=21395&amp;id_parent=33943
</link_site>

我必須獲取此鏈接並將其保存,但是它的保存方式如下: id_parent=33943

解析器代碼段:

//inside method startElement
else if(localName.equals("link_site")){
    this.in_link=true;
}
...
//inside method endElement
else if(localName.equals("link_site"){
     this.in_link=false;
}

然后,我得到了內容

else if(this.in_link){
    xmlparsing.setOrderLink(count, Html.fromHtml(new String(ch, start, length)).toString());
}//I get it and put in a HashMap<Integer,String>

我知道此問題是由於特殊字符編碼引起的。

我能做什么?

&使解析器拆分行並多次調用character()方法。 您需要隱藏這些塊。 像這樣

    SAXParserFactory.newInstance().newSAXParser()
            .parse(new File("1.xml"), new DefaultHandler() {
                String url;
                String element;

                @Override
                public void startElement(String uri, String localName, String qName,
                        Attributes attributes) throws SAXException {
                    element = qName;
                    url = "";
                }

                @Override
                public void characters(char[] ch, int start, int length) throws SAXException {
                    if (element.equals("link_site")) {
                        url += new String(ch, start, length); 
                    }
                }

                @Override
                public void endElement(String uri, String localName, String qName)
                        throws SAXException {
                    if (element.equals("link_site")) {
                        System.out.println(url.trim());
                        element = "";
                    }
                }
            });

版畫

http://www.ownhosting.com/webservice_332.asp?id_user=21395&id_parent=33943

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM