![](/img/trans.png)
[英]Parsing XML tags through Python and replace it using xml.dom.minidom
[英]Counting number of xml tags in python using xml.dom.minidom
我的XML文件test.xml包含以下標記
<?xml version="1.0" encoding="ISO-8859-1"?>
<AppName>
<author>Subho Halder</author>
<description> Description</description>
<date>2012-11-06</date>
<out>Output 1</out>
<out>Output 2</out>
<out>Output 3</out>
</AppName>
我想計算<out>
標記發生的次數
到目前為止,這是我編寫的python代碼:
from xml.dom.minidom import parseString
file = open('test.xml','r')
data = file.read()
file.close()
dom = parseString(data)
if (len(dom.getElementsByTagName('author'))!=0):
xmlTag = dom.getElementsByTagName('author')[0].toxml()
author = xmlTag.replace('<author>','').replace('</author>','')
print author
有人可以幫我嗎?
嘗試len(dom.getElementsByTagName('out'))
from xml.dom.minidom import parseString
file = open('test.xml','r')
data = file.read()
file.close()
dom = parseString(data)
print len(dom.getElementsByTagName('out'))
給
3
我建議使用lxml
import lxml.etree
doc = lxml.etree.parse(test.xml)
count = doc.xpath('count(//out)')
您可以在此處查找有關XPATH的更多信息。
如果需要,還可以使用ElementTree 。 通過下面的功能,您將獲得一個字典,其中以標簽名稱為鍵,以及在XML文件中遇到該標簽的次數。
import xml.etree.ElementTree as ET
from collections import Counter
def count_tags(filename):
my_tags = []
for event, element in ET.iterparse(filename):
my_tags.append(element.tag)
my_keys = Counter(my_tags).keys()
my_values = Counter(my_tags).values()
my_dict = dict(zip(my_keys, my_values))
return my_dict
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.