在python中的xml标记之间提取文本

Question

我在下面有xml字符串，并尝试在每个条目标签的标签域，receive_time，serial和seqno之间打印文本。

xml="""
<response status="success" code="19"><result><msg><line>query job enqueued with jobid 19032</line></msg><job>19032</job></result></response>
19032
<response status="success"><result>
  <job>
    <tenq>14:10:09</tenq>
    <tdeq>14:10:09</tdeq>
    <tlast>19:00:00</tlast>
    <status>ACT</status>
    <id>19032</id>
    <cached-logs>64</cached-logs>
  </job>
  <log>
    <logs count="20" progress="29">
      <entry logid="2473601">
        <domain>1</domain>
        <receive_time>2017/11/26 14:10:08</receive_time>
        <serial>007901004140</serial>
        <seqno>10156449120</seqno>
      </entry>
      <entry logid="2473601">
        <domain>1</domain>
        <receive_time>2017/11/26 14:10:08</receive_time>
        <serial>007901004140</serial>
        <seqno>10156449120</seqno>
      </entry>
      </logs>
  </log>
</result></response>
"""

使用xml.etree.ElementTree。 要获取域标记之间的内容我正在尝试node.attrib.get（'domain'）或node.get（'domain'） ..请提供建议

import xml.etree.ElementTree as ET
tree = ET.fromstring(xml)
for node in tree.iter('entry'):
        print node

它也可以是其他python库，不必是xml.etree。 我不想盲目地在标签之间打印文本，我需要打印标签名称后跟文本，即：

domain: 1
receive_time: 2017/11/26 14:10:08
serial: 007901004140
seqno: 10156449120

etc

Answer 1

您首先使用find()方法找到domain标记。 然后， tag属性和text属性应该获取您要查找的详细信息 -

import xml.etree.ElementTree as ET
tree = ET.fromstring(xml)
for node in tree.iter('entry'):
    print('\n')
    for elem in node.iter():
        if not elem.tag==node.tag:
            print("{}: {}".format(elem.tag, elem.text))

希望这可以帮助！

输出 -

domain: 1
receive_time: 2017/11/26 14:10:08
serial: 007901004140
seqno: 10156449120


domain: 1
receive_time: 2017/11/26 14:10:08
serial: 007901004140
seqno: 10156449120

Answer 2

您可以使用SAX Streams获取xml元素的内部文本内容。 SAX是解析xml而不将整个XML读入内存（即DOM Python SAX ）的更好方法

在python中的xml标记之间提取文本

问题描述

2 个解决方案

解决方案1
2 已采纳 2017-11-26 19:43:21

解决方案2
2 2017-11-26 19:43:28

在python中的xml标记之间提取文本

问题描述

2 个解决方案

解决方案1 2 已采纳 2017-11-26 19:43:21

解决方案2 2 2017-11-26 19:43:28

解决方案1
2 已采纳 2017-11-26 19:43:21

解决方案2
2 2017-11-26 19:43:28