簡體   English   中英

Python - Pandas 組合多個文件的部分

[英]Python - Pandas Combining parts of multiple files

在一個文件夾中列出 200 個左右的文件。 每個都有相同數量的列,但命名可能會有一些變化。 例如,我可以擁有全局 ID 或全局 ID 或全局 ID。 有沒有辦法控制熊貓列名稱中的大小寫,以便它等於什么無關緊要? 目前,它將通過 200 個文件中的前 15 個左右的文件,並且會因為找不到全局 ID 而出錯。

請注意,我是初學者並且仍在學習。

import pandas as pd
import glob

with open('test99.txt' , 'a') as out:
    list_of_files = glob.glob('M:\AD HOC Docs\Client\Blinded\*')
    for file_name in list_of_files:
        df = pd.read_table(file_name, low_memory=False)
        df['Client'] = file_name.split("_")[2].strip()
        Final = df[['Client','ClientID','Global ID','Internal ID','campaign type','engagement type', 'file_name']]
        Final.to_csv(out,index=False)

使用header=None, names=[list of column names you want to use]作為read_table附加參數來忽略標題行並獲得一致的名稱。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM