[英]Reading XML file using xml.dom.minidom or elementtree - Python
[英]XML reading using ElementTree
我有一个xml文件。
<Item>Item value</Item>
<Itemdate>24/07/2010</Itemdate>
<Total>1</Total>
<Itemcategory>Income</Itemcategory>
<GroupName>Salary</GroupName>
<EditId>undefined</EditId>
<Item>Item value</Item>
<Itemdate>24/07/2010</Itemdate>
<Total>1</Total>
<Itemcategory>Income</Itemcategory>
<GroupName>Salary</GroupName>
<EditId>undefined</EditId>
<Item>Item value</Item>
<Itemdate>24/07/2010</Itemdate>
<Total>1</Total>
<Itemcategory>Income</Itemcategory>
<GroupName>Trfr fm Savings</GroupName>
<EditId>undefined</EditId>
<Item>Item value</Item>
<Itemdate>24/07/2010</Itemdate>
<Total>1</Total>
<Itemcategory>Income</Itemcategory>
<GroupName>Dividend</GroupName>
<EditId>undefined</EditId>
<Item>Item value</Item>
<Itemdate>24/07/2010</Itemdate>
<Total>1</Total>
<Itemcategory>Income</Itemcategory>
<GroupName>Dividend</GroupName>
<EditId>undefined</EditId>
现在我想使用elementtree分别获取所有项目,itemdate等。 有人可以帮助我吗?
RGDS,
Nimmy
就像sje397在评论中写道,如果可以选择的话,应该对其进行重组。 要么全部放入item标签:
<item>
<value>...</value>
<date>...</date>
...
</item>
或使用属性:
<item value="..." date="..." ... />
这些在很大程度上是等效的(尽管属性可以以任何顺序出现,但是可以通过Schema / DTD将标签强制为特定顺序),但必须这样做的例外,我认为这是一个问题。 当然,您可以将两者混合使用,但这会使信息提取变得复杂(因为您将需要使用单独的方法来获取属性与标签)。 无论哪种方式,您都只会获得一个item标签,然后再获取其所有[children | attributes]。
如果xml必须绝对保留这种方式,则您可能需要研究SAX解析器,该解析器固有地保留了标签的顺序。 但是,它需要基于事件的方法。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.