python lxml遍历所有标签

Question

我有一个字典，将每个xml标签映射到字典键。 我想遍历xml中的每个标记和文本字段，并将其与关联的dict键值进行比较，该键值是另一个dict中的键。

<2gMessage>
    <Request>
        <pid>daemon</pid>
        <emf>123456</emf>
        <SENum>2041788209</SENum>
        <MM>
            <MID>jbr1</MID>
            <URL>http://jimsjumbojoint.com</URL>
        </MM>
        <AppID>reddit</AppID>
        <CCS>
            <Mode>
                <SomeDate>true</CardPresent>
                <Recurring>false</Recurring>
            </Mode>
            <Date>
                <ASCII>B4788250000028291^RRR^15121015432112345601</ASCII>
            </Date>
            <Amount>100.00</Amount>
        </CCS>
    </Request>
</2gMessage>

我到目前为止的代码：

parser = etree.XMLParser(ns_clean=True, remove_blank_text=True)
tree   = etree.fromstring(strRequest, parser)
for tag in tree.xpath('//Request'):
    subfields = tag.getchildren()
    for subfield in subfields:
        print (subfield.tag, subfield.text)
return strRequest

但是，这仅打印作为Request的直接子代的标签，如果它是同一循环中的实例，我希望能够访问子代上的子代。 我不想对值进行硬编码，因为标签和结构可以更改。

Answer 1

您可以尝试使用iter()函数。 它将遍历所有子元素。 长度的比较是仅打印没有子项的那些：

像这样的完整脚本：

from lxml import etree
tree = etree.parse('xmlfile')
for tag in tree.iter():
    if not len(tag):
        print (tag.tag, tag.text)

产量：

pid daemon
emf 123456
SENum 2041788209
MID jbr1
URL http://jimsjumbojoint.com
AppID reddit
CardPresent true
Recurring false
ASCII B4788250000028291^RRR^15121015432112345601
Amount 100.00

python lxml遍历所有标签

问题描述

1 个解决方案

解决方案1
4 已采纳 2015-02-09 17:29:29

python lxml遍历所有标签

问题描述

1 个解决方案

解决方案1 4 已采纳 2015-02-09 17:29:29

解决方案1
4 已采纳 2015-02-09 17:29:29