Python：從xml提取文本

Question

我有一個充滿XML文件的目錄。 我想瀏覽所有文件，將文本提取到一個新文件中，然后像XML中的meta-tag和一個數字一樣命名新文件。

示例：所有XML文件如下所示：

<?xml version='1.0' encoding='UTF-8'?>
<event><event id="9936070" origin="2008_01.xml"><meta/><text><original>Here is the text.</original>
</text><actors><actor><name>Enterprise</name><polarity>negativ implizit</polarity><centrality>zentral</centrality></actor></actors></event></event>

現在，我想提取文本（“此處是文本。”）並將其保存在名為“ Enterprise_2008_01.xml”的文件中。 這怎么可能？ 並且，尤其是，如何考慮所有文件，並根據情況增加最后一個數字（如果還有另一個帶有2008年標簽“ Enterprise”的文件，則文件名應為“ Enterprise_2008_02.xml”。）很多幫助！:)

Answer 1

import xml.etree.ElementTree as eltre
path = 'C:/myfile.xml'
eTree = eltre.ElementTree()
eTree.parse(path)
elements = list(eTree.getroot())
for el in elements:
    print el.text
    #prints body
    print el.tag
    #prints elementName
    print el.attrib
    #prints attributes
    childElements = list(el)
    #gets children

Python：從xml提取文本

問題描述

1 個解決方案

解決方案1
0 2014-03-08 19:23:46

Python：從xml提取文本

問題描述

1 個解決方案

解決方案1 0 2014-03-08 19:23:46

解決方案1
0 2014-03-08 19:23:46