簡體   English   中英

Python:使用ElementTree讀取和寫入命名空間的XML

[英]Python: Read and write namespaced XML using ElementTree

此XML文件名為example.xml

<?xml version="1.0"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">

  <modelVersion>14.0.0</modelVersion>
  <groupId>.com.foobar.flubber</groupId>
  <artifactId>uberportalconf</artifactId>
  <version>13-SNAPSHOT</version>
  <packaging>pom</packaging>
  <name>Environment for UberPortalConf</name>
  <description>This is the description</description>    
  <properties>
      <birduberportal.version>11</birduberportal.version>
      <promotiondevice.version>9</promotiondevice.version>
      <foobarportal.version>6</foobarportal.version>
      <eventuberdevice.version>2</eventuberdevice.version>
  </properties>
  <!-- A lot more here, but as it is irrelevant for the problem I have removed it -->
</project>

如果我使用ElementTree加載上面的example.xml文件並打印根節點:

>>> from xml.etree import ElementTree
>>> tree = ElementTree.parse('example.xml')
>>> print tree.getroot()
<Element '{http://maven.apache.org/POM/4.0.0}project' at 0x26ee0f0>

我看到Element還包含名稱空間http://maven.apache.org/POM/4.0.0

我如何:

  1. 獲取foobarportal.version文本,將其增加一個並將XML文件寫回,同時保留文檔在加載時具有的命名空間,也不會更改整個XML布局。
  2. 使用任何命名空間加載它,而不僅僅是http://maven.apache.org/POM/4.0.0 我仍然不想剝離命名空間,因為我希望XML保持不變,除了改變foobarportal.version如上面1所示。

目前的方式不知道XML,但滿足上面的12

  1. grep for <foobarportal.version>(.*)</foobarportal.version>
  2. 獲取匹配組的內容,然后將其增加1
  3. 寫回來。

擁有XML感知解決方案會很好,因為它會更強大。 ElementTree的XML命名空間處理使其更加復雜。

如果您的問題只是:“我如何通過命名空間元素名稱進行搜索”,那么答案是lxml理解{namespace}語法,因此您可以:

tree.getroot().find('{http://maven.apache.org/POM/4.0.0}project')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM