Python - Pandas 組合多個文件的部分

Question

在一個文件夾中列出 200 個左右的文件。 每個都有相同數量的列，但命名可能會有一些變化。 例如，我可以擁有全局 ID 或全局 ID 或全局 ID。 有沒有辦法控制熊貓列名稱中的大小寫，以便它等於什么無關緊要？ 目前，它將通過 200 個文件中的前 15 個左右的文件，並且會因為找不到全局 ID 而出錯。

請注意，我是初學者並且仍在學習。

import pandas as pd
import glob

with open('test99.txt' , 'a') as out:
    list_of_files = glob.glob('M:\AD HOC Docs\Client\Blinded\*')
    for file_name in list_of_files:
        df = pd.read_table(file_name, low_memory=False)
        df['Client'] = file_name.split("_")[2].strip()
        Final = df[['Client','ClientID','Global ID','Internal ID','campaign type','engagement type', 'file_name']]
        Final.to_csv(out,index=False)

Answer 1

使用header=None, names=[list of column names you want to use]作為read_table附加參數來忽略標題行並獲得一致的名稱。

Python - Pandas 組合多個文件的部分

問題描述

1 個解決方案

解決方案1
2 2016-10-11 19:30:36

Python - Pandas 組合多個文件的部分

問題描述

1 個解決方案

解決方案1 2 2016-10-11 19:30:36

解決方案1
2 2016-10-11 19:30:36