解析python目录中的每个文件？

Question

所以我有这段代码：

import xml.etree.ElementTree as ET
tree = ET.parse('test.xml')
root = tree.getroot()

for segment in root.iter("s"):
    for word in segment.iter("w"):
        print word.text,
    print "\n"

这将解析xml文件test.xml并打印已解析的输出。 但是，我有大量需要在目录中解析的这些xml文件。 如何修改代码，使其遍历目录中的每个文件并对其应用此功能？

谢谢！

Answer 1

这应该工作：

def printParsed(filename):
    tree = ET.parse(filename)
    root = tree.getroot()

    for segment in root.iter("s"):
        for word in segment.iter("w"):
            print word.text,
        print "\n"

if __name__ == "__main__":
    from os import listdir
    from os.path import isfile, join
    mypath ='path/to/your/xml/files'
    onlyfiles = [ f for f in listdir(mypath) if isfile(join(mypath,f)) ]
    for f in onlyfiles:
        # only does stuff if the file ends in xml
        if f[-3:] = '.xml':
            printParsed(f)

您可以将文件保存为parser.py ，然后像python parser.py一样运行它。 如果需要，还可以删除if __name__ == "__main__"部分。

Answer 2

使用os.listdir（path）

它返回目录中所有文件的列表。

码：

import xml.etree.ElementTree as ET
import os
listofxml = os.listdir("./")
    for xml in listofxml:
        tree = ET.parse(xml)
        root = tree.getroot()

        for segment in root.iter("s"):
                for word in segment.iter("w"):
                        print word.text,
                print "\n"

如果不是所有文件都是xml，则可以拆分并检查：

import xml.etree.ElementTree as ET
import os
listofxml = os.listdir("./")
    for xml in listofxml:
        format = xml.split('.')
        if format[-1] == 'xml':
            tree = ET.parse(xml)
            root = tree.getroot()

            for segment in root.iter("s"):
                    for word in segment.iter("w"):
                            print word.text,
                    print "\n"

解析python目录中的每个文件？

问题描述

2 个解决方案

解决方案1
0 2015-11-18 02:41:46

解决方案2
0 已采纳 2015-11-18 02:42:31

解析python目录中的每个文件？

问题描述

2 个解决方案

解决方案1 0 2015-11-18 02:41:46

解决方案2 0 已采纳 2015-11-18 02:42:31

解决方案1
0 2015-11-18 02:41:46

解决方案2
0 已采纳 2015-11-18 02:42:31