簡體   English   中英

從文件夾中打開並讀取多個xml文件

[英]Open and read multiple xml files from the folder

以下持有人擁有100多個XML文件。 我必須打開並閱讀所有這些文件。

F:\\過程\\ Process_files \\個XML

到目前為止,我執行了以下代碼以從文件夾中打開單個XML文件。 我需要更改以打開/讀取文件夾中的所有XML文件。

from bs4 import BeautifulSoup
import lxml
import pandas as pd

infile = open("F:\\Process\\Process_files\\xmls\\ABC123.xml","r")
contents = infile.read()
soup = BeautifulSoup(contents,'html.parser')

使用globos模塊遍歷具有給定文件擴展名的給定path每個文件:

import glob
import os

path = "F:/Process/Process_files/xmls/"

for filename in glob.glob(os.path.join(path, "*.xml")):
    with open(filename) as open_file:
        content = open_file.read()

    soup = BeautifulSoup(content, "html.parser")

提示:使用with語句,使文件最后自動關閉。

來源: 打開文件夾中的每個文件

因此,您需要遍歷文件夾中的文件? 您可以嘗試如下操作:

for file in os.listdir(path):
    filepath = os.path.join(path, file)
    with open(filepath) as fp:
        contents = fp.read()
        soup = BeautifulSoup(contents, 'html.parser')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM