[英]python iterate xml avoiding namespace
使用我的 python 腳本,我想迭代我的 xml 文件來搜索特定的元素標簽。 我有一些與根標記的命名空間相關的問題。
在我的XML結構下面:
<?xml version="1.0" ?>
<rootTag xmlns="blablabla">
<tag_1>
<sub_tag_1>..something..</sub_tag_1>
</tag_1>
<tag_2>
<sub_tag_2>..something..</sub_tag_2>
</tag_2>
...and so on...
</rootTag>
在我的PYTHON腳本下面:
import xml.etree.ElementTree as ET
root = ET.fromstring(xml_taken_from_web)
print(root.tag)
問題是打印的輸出是:
{blablabla}rootTag
因此,當我遍歷它時,所有 tag_1、tag_2 等標簽都將包含 {blablabla} 字符串,因此我無法對標簽進行任何檢查。
我嘗試以這種方式使用正則表達式
root = re.sub('^{.*?}', '', root.tag)
問題是之后的 root 是一個字符串類型,所以我不能覆蓋它這樣的 Element 類型
如何只打印 rootTag ?
只需使用:
import xml.etree.ElementTree as ET
from lxml import etree
root = ET.fromstring(xml_taken_from_web)
print(etree.QName(root.tag).localname)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.