簡體   English   中英

將文檔類型插入XML文檔(Java / SAX)

[英]Insert a doctype into an XML document (Java/ SAX)

假設您有一個XML文檔,並假設您有DTD,但是文檔本身實際上沒有指定DOCTYPE ...如何插入DOCTYPE聲明,最好是在解析器中指定它(類似於設置模式的方法) (用於將要解析的文檔)還是通過XMLFilter等插入必要的SAX事件?

我發現了許多對EntityResolver引用,但這是在解析過程中找到 DOCTYPE並將其用於指向本地DTD文件時調用的。 EntityResolver2似乎具有我想要的功能,但是我沒有找到任何用法示例。

這是我到目前為止最接近的代碼:(代碼是Groovy,但是足夠接近,您應該能夠理解它...)

import org.xml.sax.*
import org.xml.sax.ext.*
import org.xml.sax.helpers.*

class XmlFilter extends XMLFilterImpl {
    public XmlFilter( XMLReader reader ) { super(reader) }

    @Override public void startDocument() {
        super.startDocument()        
        super.resolveEntity( null, 
            'file:///./entity.dtd')
        println "filter startDocument"
    }
}

class MyHandler extends DefaultHandler2 { 
    public InputSource resolveEntity(String name, String publicId, String baseURI, String systemId) {
        println "entity: $name, $publicId, $baseURI, $systemId"
        return new InputSource(new StringReader('<!ENTITY asdf "&#161;">'))
    }
}

def handler = new MyHandler()

def parser = XMLReaderFactory.createXMLReader()
parser.setFeature 'http://xml.org/sax/features/use-entity-resolver2', true
def filter = new XmlFilter( parser )
filter.setContentHandler( handler )
filter.setEntityResolver( handler )

filter.parse( new InputSource(new StringReader('''<?xml version="1.0" ?>
    <test>one &asdf; two! &nbsp; &iexcl;&pound;&cent;</test>''')) );

我看到resolveEntity調用了,但仍然命中

org.xml.sax.SAXParseException:已引用但未聲明實體“ asdf”。
在com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(AbstractSAXParser.java:1231)
在org.xml.sax.helpers.XMLFilterImpl.parse(XMLFilterImpl.java:333)

我猜這是因為沒有辦法添加解析器知道的SAX事件,我只能通過解析器上游的過濾器添加事件,這些過濾器會傳遞給ContentHandler。 因此,進入XMLReader的文檔必須有效。 可以解決嗎? 我知道我可以修改原始流以添加文檔類型,也可以進行轉換以設置DTD ...還有其他選擇嗎?

您可以嘗試DoctypeChanger ,它按照您的建議修改原始流:

DoctypeChanger是一個Java類,通過它您可以在字節流中將DOCTYPE聲明添加到XML解析器中時對其進行添加,修改或刪除。

InputStream in = ...   // get your XML InputStream
DOCTYPEChangerStream changer = new DOCTYPEChangerStream(in);
changer.setGenerator( 
    new DoctypeGenerator() {
        public Doctype generate(Doctype old) {
            return new DoctypeImpl("rootElement", "pubId", "sysId", "internalSubset");
        }
    } 
);
// .. and pass it on to the parser.

我將使用xslt樣式表進行身份轉換,並使用xsl:output元素以及doctype-system屬性(如果要添加公共標識符,還可以使用doctype-public )。

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output doctype-system="test.dtd"/>
   <xsl:template match="node()|@*">
      <xsl:copy>
         <xsl:apply-templates select="node()|@*"/>
      </xsl:copy>
   </xsl:template>
</xsl:stylesheet>

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM