繁体   English   中英

如何在Python中使用紧凑的RELAX NG模式验证XML文档?

[英]How do I validate XML document using compact RELAX NG schema in Python?

如何通过Python中的紧凑RELAX NG模式验证XML文档?

使用lxml怎么样?

来自文档:

>>> f = StringIO('''\
... <element name="a" xmlns="http://relaxng.org/ns/structure/1.0">
...  <zeroOrMore>
...     <element name="b">
...       <text />
...     </element>
...  </zeroOrMore>
... </element>
... ''')
>>> relaxng_doc = etree.parse(f)
>>> relaxng = etree.RelaxNG(relaxng_doc)

>>> valid = StringIO('<a><b></b></a>')
>>> doc = etree.parse(valid)
>>> relaxng.validate(doc)
True

>>> invalid = StringIO('<a><c></c></a>')
>>> doc2 = etree.parse(invalid)
>>> relaxng.validate(doc2)
False

如果你想通过命令行进行语法检查VS 紧凑 RelaxNG语法,就可以使用pyjing ,从jingtrang模块。

它支持.rnc文件并显示更多详细信息,而不仅仅是TrueFalse 例如:

C:\>pyjing -c root.rnc invalid.xml
C:\invalid.xml:9:9: error: element "name" not allowed here; expected the element end-tag or element "bounds"

注意:它是Java jingtrang的Python包装器,因此需要安装Java。

如果要从Python中检查语法,可以

  1. 使用pytrang (来自jingtrang包装器)将“Compact RelaxNG”(。 rnc )转换为XML RelaxNG( .rng ): pytrang root.rnc root.rng

  2. 使用lxml解析转换后的.rng文件,如下所示: https//lxml.de/validation.html#relaxng

那将是这样的:

>>> from lxml import etree
>>> from subprocess import call

>>> call("pytrang root.rnc root.rng")

>>> with open("root.rng") as f:
...    relaxng_doc = etree.parse(f)
>>> relaxng = etree.RelaxNG(relaxng_doc)

>>> valid = StringIO('<a><b></b></a>')
>>> doc = etree.parse(valid)
>>> relaxng.validate(doc)
True

>>> invalid = StringIO('<a><c></c></a>')
>>> doc2 = etree.parse(invalid)
>>> relaxng.validate(doc2)
False

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM