python迭代xml避免命名空間

Question

使用我的 python 腳本，我想迭代我的 xml 文件來搜索特定的元素標簽。 我有一些與根標記的命名空間相關的問題。

在我的XML結構下面：

<?xml version="1.0" ?>
<rootTag xmlns="blablabla">
    <tag_1>
        <sub_tag_1>..something..</sub_tag_1>
    </tag_1>
    <tag_2>
        <sub_tag_2>..something..</sub_tag_2>
    </tag_2>
    ...and so on...
</rootTag>

在我的PYTHON腳本下面：

import xml.etree.ElementTree as ET

root = ET.fromstring(xml_taken_from_web)
print(root.tag)

問題是打印的輸出是：

{blablabla}rootTag

因此，當我遍歷它時，所有 tag_1、tag_2 等標簽都將包含 {blablabla} 字符串，因此我無法對標簽進行任何檢查。

我嘗試以這種方式使用正則表達式

root = re.sub('^{.*?}', '', root.tag)

問題是之后的 root 是一個字符串類型，所以我不能覆蓋它這樣的 Element 類型

如何只打印 rootTag ？

Answer 1

只需使用：

import xml.etree.ElementTree as ET
from lxml import etree

root = ET.fromstring(xml_taken_from_web)
print(etree.QName(root.tag).localname)

python迭代xml避免命名空間

問題描述

1 個解決方案

解決方案1
2 已采納 2020-01-28 09:51:02

python迭代xml避免命名空間

問題描述

1 個解決方案

解決方案1 2 已采納 2020-01-28 09:51:02

解決方案1
2 已采納 2020-01-28 09:51:02