XML解析如何在SAX解析器内部工作？

Question

我正在尝试使用SAX解析XML。 下面是一个代码片段：

public class ReadXML {

   public static void main(String argv[]) {

    try {

    SAXParserFactory factory = SAXParserFactory.newInstance();
    SAXParser saxParser = factory.newSAXParser();

    DefaultHandler handler = new DefaultHandler() {

    boolean bfname = false;
    boolean blname = false;
    boolean bnname = false;
    boolean bsalary = false;

    public void startElement(String uri, String localName,String qName, 
                Attributes attributes) throws SAXException {

        System.out.println("Parameters :" + uri +":"+ localName +":"+ qName +":"+ attributes);
        System.out.println("Start Element :" + qName);

        if (qName.equalsIgnoreCase("FIRSTNAME")) {
            bfname = true;
        }

        if (qName.equalsIgnoreCase("LASTNAME")) {
            blname = true;
        }

        if (qName.equalsIgnoreCase("NICKNAME")) {
            bnname = true;
        }

        if (qName.equalsIgnoreCase("SALARY")) {
            bsalary = true;
        }

    }

    public void endElement(String uri, String localName,
        String qName) throws SAXException {

        System.out.println("End Element :" + qName);

    }

    public void characters(char[] ch, int start, int length) throws SAXException {

        System.out.println("Im here:"+Arrays.toString(ch));
        if (bfname) {
            System.out.println("First Name : " + new String(ch, start, length));
            bfname = false;
        }

        if (blname) {
            System.out.println("Last Name : " + new String(ch, start, length));
            blname = false;
        }

        if (bnname) {
            System.out.println("Nick Name : " + new String(ch, start, length));
            bnname = false;
        }

        if (bsalary) {
            System.out.println("Salary : " + new String(ch, start, length));
            bsalary = false;
        }

    }

     };

       saxParser.parse("C:\\Lenny\\Work\\XML\\SaxParsing_01.xml", handler); --(1)


     } catch (Exception e) {
       e.printStackTrace();
     }

   }

}

我的第一个问题是，代码到达saxParser.parse("C:\\\\Ashish\\\\Work\\\\XML\\\\SaxParsing_01.xml", handler); ，下面的两个方法被调用..！

    public void parse(File f, HandlerBase hb)
            throws SAXException, IOException {
            if (f == null) {
                throw new IllegalArgumentException("File cannot be null");
            }

            String escapedURI = FilePathToURI.filepath2URI(f.getAbsolutePath());
            if (DEBUG) {
                System.out.println("Escaped URI = " + escapedURI);
            }
            InputSource input = new InputSource(escapedURI);
            this.parse(input, hb);
        }

public void parse(InputSource is, DefaultHandler dh)
        throws SAXException, IOException {
        if (is == null) {
            throw new IllegalArgumentException("InputSource cannot be null");
        }
        XMLReader reader = this.getXMLReader();
        if (dh != null) {
            reader.setContentHandler(dh);
            reader.setEntityResolver(dh);
            reader.setErrorHandler(dh);
            reader.setDTDHandler(dh);
        }
        reader.parse(is);
    }

想知道，当reader.parse(is)时会发生什么？ 我唯一假设的是， reader正在读取XML，并将其放入上述代码中创建的DefautHandler的数据结构中，并相应地产生输出。

我尝试了很多方法来找出parse(is)方法的源代码，但找不到它。 在SAXParser类中，parse是一种抽象方法，因此无法在实现类中找到可以检查源代码并进一步理解的地方。

第二个愚蠢的问题，当我们创建DefautHandler实例时，请问我是否知道该块内的方法是否被覆盖？ 在构造函数的块中，是否允许像创建四个布尔变量一样创建变量？ 在Java中从未见过这种方法。

有人可以帮我做同样的事情吗...？

谢谢

Answer 1

SAXParser是一个接口，并且有许多实现该接口的XML解析器。 如果您想知道它是如何工作的，则需要选择以下XML解析器之一-最易于访问的是Apache Xerces解析器。 您可以从这里开始，但要警告它不容易阅读：

https://apache.googlesource.com/xerces2-j/+/f59f47412e404f4984480a45a99957ac07d287d4/src/org/apache/xerces/parsers/AbstractSAXParser.java

简单来说，解析器将查找“ <”，当找到解析器时，它将使用适当的参数调用提供的ContentHandler的startElement()方法。

尽管可以做得很好，但实际上不需要了解它如何在内部工作以成功利用SAX解析器。

没错，编写SAX ContentHandler（也许是DefaultHandler的扩展）所涉及的Java编程风格与您惯用的风格截然不同。 因为您的代码正在通过回调处理事件，所以您无法像拥有主控制循环那样维护堆栈上的当前状态。 相反，您必须考虑对诸如startElement（）或character（）之类的方法的每次调用如何影响应用程序需要维护的当前状态，并弄清楚如何修改保存该状态的数据结构。 这是一种完全不同的编程方式，也是有人说“拉”解析接口比“推”接口更易于使用的原因之一。

XML解析如何在SAX解析器内部工作？

问题描述

1 个解决方案

解决方案1
1 2019-03-10 22:27:00

XML解析如何在SAX解析器内部工作？

问题描述

1 个解决方案

解决方案1 1 2019-03-10 22:27:00

解决方案1
1 2019-03-10 22:27:00