[英]Python: Read and write namespaced XML using ElementTree
此XML文件名为example.xml
:
<?xml version="1.0"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
<modelVersion>14.0.0</modelVersion>
<groupId>.com.foobar.flubber</groupId>
<artifactId>uberportalconf</artifactId>
<version>13-SNAPSHOT</version>
<packaging>pom</packaging>
<name>Environment for UberPortalConf</name>
<description>This is the description</description>
<properties>
<birduberportal.version>11</birduberportal.version>
<promotiondevice.version>9</promotiondevice.version>
<foobarportal.version>6</foobarportal.version>
<eventuberdevice.version>2</eventuberdevice.version>
</properties>
<!-- A lot more here, but as it is irrelevant for the problem I have removed it -->
</project>
如果我使用ElementTree加载上面的example.xml文件并打印根节点:
>>> from xml.etree import ElementTree
>>> tree = ElementTree.parse('example.xml')
>>> print tree.getroot()
<Element '{http://maven.apache.org/POM/4.0.0}project' at 0x26ee0f0>
我看到Element还包含名称空间http://maven.apache.org/POM/4.0.0
。
我如何:
foobarportal.version
文本,将其增加一个并将XML文件写回,同时保留文档在加载时具有的命名空间,也不会更改整个XML布局。 http://maven.apache.org/POM/4.0.0
。 我仍然不想剥离命名空间,因为我希望XML保持不变,除了改变foobarportal.version
如上面1所示。 目前的方式不知道XML,但满足上面的1和2 :
<foobarportal.version>(.*)</foobarportal.version>
拥有XML感知解决方案会很好,因为它会更强大。 ElementTree的XML命名空间处理使其更加复杂。
如果您的问题只是:“我如何通过命名空间元素名称进行搜索”,那么答案是lxml理解{namespace}
语法,因此您可以:
tree.getroot().find('{http://maven.apache.org/POM/4.0.0}project')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.