將多個 CSV 文件與區分大小寫的列名稱與 Python 組合

Question

我在一個文件夾中有多個文件具有相同的列詳細信息。 但是，對於某些文件，列名是小寫，而 rest 的列名是大寫。

我正在使用下面的代碼將它們連接到一個文件中

path = r'folder'
file = glob.glob(os.path.join(path, 'Add', "*.csv"))
data = pd.concat((pd.read_csv(f, sep=',', encoding='latin-1') for f in file), ignore_index=True, sort=True)
data['Period'] = '202007' #Period Column is required as string

單個文件有 40 列，但是當我通過“pd.concat”添加所有文件時，我得到 81 列（大寫 40 + 小寫 40 + 創建的 1 列）。

我需要最終的 output 為 41 列 - 大寫/小寫的 40 列 + 1 個創建的列

感謝 Sid 的 concat 幫助。

更新（數據類型）：我的數據中有不同的數據類型（int、float、object）。

Answer 1

在連接數據框之前，嘗試將列名全部轉換為小寫：

df.columns = df.columns.str.lower()

您還應該統一數據類型。 為此，請查看astype

將多個 CSV 文件與區分大小寫的列名稱與 Python 組合

問題描述

1 個解決方案

解決方案1
1 2020-08-06 07:52:17

將多個 CSV 文件與區分大小寫的列名稱與 Python 組合

問題描述

1 個解決方案

解決方案1 1 2020-08-06 07:52:17

解決方案1
1 2020-08-06 07:52:17