[英]Python: Extract text from xml
我有一個充滿XML文件的目錄。 我想瀏覽所有文件,將文本提取到一個新文件中,然后像XML中的meta-tag和一個數字一樣命名新文件。
示例:所有XML文件如下所示:
<?xml version='1.0' encoding='UTF-8'?>
<event><event id="9936070" origin="2008_01.xml"><meta/><text><original>Here is the text.</original>
</text><actors><actor><name>Enterprise</name><polarity>negativ implizit</polarity><centrality>zentral</centrality></actor></actors></event></event>
現在,我想提取文本(“此處是文本。”)並將其保存在名為“ Enterprise_2008_01.xml”的文件中。 這怎么可能? 並且,尤其是,如何考慮所有文件,並根據情況增加最后一個數字(如果還有另一個帶有2008年標簽“ Enterprise”的文件,則文件名應為“ Enterprise_2008_02.xml”。)很多幫助!:)
import xml.etree.ElementTree as eltre
path = 'C:/myfile.xml'
eTree = eltre.ElementTree()
eTree.parse(path)
elements = list(eTree.getroot())
for el in elements:
print el.text
#prints body
print el.tag
#prints elementName
print el.attrib
#prints attributes
childElements = list(el)
#gets children
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.