使用Beautiful Soup查找XML中的所有属性

Question

I have an XML file which looks something like this: 我有一个看起来像这样的XML文件：

<tagA key1="val1" key2="val2" key3="val3">
<tagB.1 key1="val1" key2="val2" key3="val3"/>
<tagB.2 key1="val1" key2="val2" key3="val3"/>
<tagB.3 key1="val1" key2="val2" key3="val3"/>
<tagB.4 key1="val1" key2="val2" key3="val3"/>
<tagB.5 key1="val1" key2="val2" key3="val3"/>
</tagA>

What I am trying to do is extract the name of key1 , key2 and key3 in tagB.x , and put them into a list. 我想要做的是在tagB.x提取key1 ， key2和key3的tagB.x ，并将它们放入列表中。 This way I can extract the values of it later. 这样我以后可以提取它的值。 It should be able to handle more or less elements, being as each file is different. 它应该能够处理更多或更少的元素，因为每个文件都不同。 Thanks! 谢谢！

Answer 1

You should use an xml parser: 您应该使用xml解析器：

xml="""
<tagA key1="val1" key2="val2" key3="val3">
<tagB.1 key1="val1" key2="val2" key3="val3"/>
<tagB.2 key1="val1" key2="val2" key3="val3"/>
<tagB.3 key1="val1" key2="val2" key3="val3"/>
<tagB.4 key1="val1" key2="val2" key3="val3"/>
<tagB.5 key1="val1" key2="val2" key3="val3"/>
</tagA>
"""


import xml.etree.ElementTree as ET

root = ET.fromstring(xml)
for child in root:
    print child.tag, child.attrib.keys()

tagB.1 ['key3', 'key2', 'key1']
tagB.2 ['key3', 'key2', 'key1']
tagB.3 ['key3', 'key2', 'key1']
tagB.4 ['key3', 'key2', 'key1']
tagB.5 ['key3', 'key2', 'key1']

使用Beautiful Soup查找XML中的所有属性

问题描述

1 个解决方案

解决方案1
2 已采纳 2014-08-23 20:59:26

使用Beautiful Soup查找XML中的所有属性

问题描述

1 个解决方案

解决方案1 2 已采纳 2014-08-23 20:59:26

解决方案1
2 已采纳 2014-08-23 20:59:26