将多个 CSV 文件与区分大小写的列名称与 Python 组合

Question

我在一个文件夹中有多个文件具有相同的列详细信息。 但是，对于某些文件，列名是小写，而 rest 的列名是大写。

我正在使用下面的代码将它们连接到一个文件中

path = r'folder'
file = glob.glob(os.path.join(path, 'Add', "*.csv"))
data = pd.concat((pd.read_csv(f, sep=',', encoding='latin-1') for f in file), ignore_index=True, sort=True)
data['Period'] = '202007' #Period Column is required as string

单个文件有 40 列，但是当我通过“pd.concat”添加所有文件时，我得到 81 列（大写 40 + 小写 40 + 创建的 1 列）。

我需要最终的 output 为 41 列 - 大写/小写的 40 列 + 1 个创建的列

感谢 Sid 的 concat 帮助。

更新（数据类型）：我的数据中有不同的数据类型（int、float、object）。

Answer 1

在连接数据框之前，尝试将列名全部转换为小写：

df.columns = df.columns.str.lower()

您还应该统一数据类型。 为此，请查看astype

将多个 CSV 文件与区分大小写的列名称与 Python 组合

问题描述

1 个解决方案

解决方案1
1 2020-08-06 07:52:17

将多个 CSV 文件与区分大小写的列名称与 Python 组合

问题描述

1 个解决方案

解决方案1 1 2020-08-06 07:52:17

解决方案1
1 2020-08-06 07:52:17