使用Python minidom解析XML

Question

 <PacketHeader>   
     <HeaderField>
        <name>number</name>
        <dataType>int</dataType>
     </HeaderField>
 </PacketHeader>

这是我的小XML文件，我想提取出名称标签内的文本。

这是我的代码片段： -

from xml.dom import minidom
from xml.dom.minidom import parse

xmldoc = minidom.parse('sample.xml')
packetHeader = xmldoc.getElementsByTagName("PacketHeader")
headerField = packetHeader.getElementsByTagName("HeaderField")
for field in headerField:
    getFieldName = field.getElementsByTagName("name")
    print getFieldName

但我得到的位置，但不是文本。

Answer 1

from xml.dom import minidom
from xml.dom.minidom import parse

xmldoc = minidom.parse('sample.xml')

# find the name element, if found return a list, get the first element
name_element = xmldoc.getElementsByTagName("name")[0]

# this will be a text node that contains the actual text
text_node = name_element.childNodes[0]

# get text
print text_node.data

请检查一下。

更新

顺便提一下 ，我建议你使用ElementTree ，下面是使用ElementTree的代码片段，它与上面的minidom代码做同样的事情

import elementtree.ElementTree as ET

tree = ET.parse("sample.xml")

# the tree root is the toplevel `PacketHeader` element
print tree.findtext("HeaderField/name")

Answer 2

上面接受的正确答案的一个小变体是：

from xml.dom import minidom


xmldoc = minidom.parse('fichier.xml')
name_element = xmldoc.getElementsByTagName('name')[0]
print name_element.childNodes[0].nodeValue

这只是使用nodeValue而不是其别名data

使用Python minidom解析XML

问题描述

2 个解决方案

解决方案1
3 已采纳 2014-08-21 06:32:02

解决方案2
0 2018-04-22 15:41:00

使用Python minidom解析XML

问题描述

2 个解决方案

解决方案1 3 已采纳 2014-08-21 06:32:02

解决方案2 0 2018-04-22 15:41:00

解决方案1
3 已采纳 2014-08-21 06:32:02

解决方案2
0 2018-04-22 15:41:00