簡體   English   中英

如何使用Stax Iterator解析xml並獲取相應的值?

[英]How to parse xml and get the corresponding values using Stax Iterator ?

我想使用STAX Iterator API解析xml節點並獲取每個id節點的值。 在下面的代碼中,如何獲取id type = id2或id3的對應值。 我怎樣才能做到這一點?

<entity>
   <id type="id1">8500123</id>
   <id type="id2">8500124</id>
   <id type="id3">8500125</id>
   <link idType="someId">99369</link>
 </entity>

下面的STAX Iterator API代碼;

XMLEventReader xmlEventReader = xmlInputFactory.createXMLEventReader(new FileInputStream(fileName));
    while (xmlEventReader.hasNext()) {
        XMLEvent xmlEvent = xmlEventReader.nextEvent();
        if (xmlEvent.isStartElement()) {
            StartElement startElement = xmlEvent.asStartElement();
            if (startElement.getName().getLocalPart().equals("entity")) {
                XMLEvent xmlEvent2 = xmlEventReader.nextEvent();//has to forgo this bcoz it always return a new line.
                XMLEvent xmlEvent3 = xmlEventReader.nextEvent();
                if (xmlEvent3.isStartElement()) {
                    StartElement startElement2 = xmlEvent3.asStartElement();
                    if (startElement2.getName().getLocalPart().equals("id")) {
                        connector = new Connector();
                        Attribute idAttr = startElement2.getAttributeByName(new QName("type"));
                        if(idAttr.getName().equals("id1")){
                            connector.setId1(idAttr.getValue());
                        }
                    }
                }
            }
        }
    } 

由於問題很舊,可能不再是問題,但是我只是想做同樣的事情。 樣本代碼幾乎在那兒了。 缺少的步驟是檢查XMLStreamConstants.CHARACTERS的事件類型,該事件類型對應於以下任意一個:

  • 開頭和結尾標簽之間的數據。
  • 標簽之間的空白。

因此,在您的情況下,僅在滿足所有以下條件時才要提取數據:

  • 正在處理的事件類型為XMLStreamConstants.CHARACTERS (在這種情況下, EventType.isCharacters()返回true)。
  • 處理的緊接事件是XMLStreamConstants.START_ELEMENT類型。
  • 該先前的起始元素的type屬性的值為“ id2”或“ id3”。

可以通過調整現有代碼來做到這一點,但是更干凈,更通用的方法是使用case語句迭代處理XMLEventReader返回的事件。 要獲取開始標記和結束標記之間的數據值:

Characters characters = xmlEvent.asCharacters();
String data = characters.getData();

這是一個工作示例,其中sample.xml文件包含OP中的數據:

package pkg;

import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;

import javax.xml.namespace.QName;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.Attribute;
import javax.xml.stream.events.Characters;
import javax.xml.stream.events.EndElement;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;

public class StaxDemo {

    public static void main(String[] args) throws XMLStreamException, IOException {

        try (Reader reader = new FileReader("sample.xml");) {
            XMLInputFactory xmlInputFactory = XMLInputFactory.newFactory();
            XMLEventReader xmlEventReader = xmlInputFactory.createXMLEventReader(reader);
            parseXml(xmlEventReader);
        }
    }

    static void parseXml(XMLEventReader xmlEventReader) throws XMLStreamException {

        String typeValue = null;

        while (xmlEventReader.hasNext()) {
            XMLEvent xmlEvent = xmlEventReader.nextEvent();
            switch (xmlEvent.getEventType()) {

            case XMLStreamConstants.START_DOCUMENT:
                System.out.println("XMLEvent.START_DOCUMENT");
                break;

            case XMLStreamConstants.START_ELEMENT:
                StartElement startElement = xmlEvent.asStartElement();
                Attribute typeAttribute = startElement.getAttributeByName(new QName("type"));
                if (typeAttribute != null) {
                    typeValue = typeAttribute.getValue();
                }
                System.out.println("XMLEvent.START_ELEMENT: <" + startElement.getName() + "> " + "type=" + typeValue);
                break;

            case XMLStreamConstants.CHARACTERS:
                Characters characters = xmlEvent.asCharacters();
                if ((typeValue != null)) { // Non-null if preceding event was for START_ELEMENT.
                    if ((typeValue.equals("id2")) || (typeValue.equals("id3"))) {
                        String data = characters.getData();
                        System.out.println("XMLEvent.CHARACTERS:    data=[" + data + "]");
                    }
                    typeValue = null;
                }
                break;

            case XMLStreamConstants.END_ELEMENT:
                EndElement endElement = xmlEvent.asEndElement();
                System.out.println("XMLEvent.END_ELEMENT:   </" + endElement.getName() + ">");
                break;

            case XMLStreamConstants.END_DOCUMENT:
                System.out.println("XMLEvent.END_DOCUMENT");
                break;

            default:
                System.out.println("case default: Event Type = " + xmlEvent.getEventType());
                break;
            }
        }
    }
}

我添加了幾個println()調用只是為了闡明XMLEventReader如何處理文件。 這是輸出:

XMLEvent.START_DOCUMENT
XMLEvent.START_ELEMENT: <entity> type=null
XMLEvent.START_ELEMENT: <id> type=id1
XMLEvent.END_ELEMENT:   </id>
XMLEvent.START_ELEMENT: <id> type=id2
XMLEvent.CHARACTERS:    data=[z8500124]
XMLEvent.END_ELEMENT:   </id>
XMLEvent.START_ELEMENT: <id> type=id3
XMLEvent.CHARACTERS:    data=[z8500125]
XMLEvent.END_ELEMENT:   </id>
XMLEvent.START_ELEMENT: <link> type=null
XMLEvent.END_ELEMENT:   </link>
XMLEvent.END_ELEMENT:   </entity>
XMLEvent.END_DOCUMENT

Oracle提供了StAX的教程 盡管所有基本信息都在這里,但我發現它有點混亂。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM