[英]Combining multiple CSV files with case sensitive column names with Python
我在一个文件夹中有多个文件具有相同的列详细信息。 但是,对于某些文件,列名是小写,而 rest 的列名是大写。
我正在使用下面的代码将它们连接到一个文件中
path = r'folder'
file = glob.glob(os.path.join(path, 'Add', "*.csv"))
data = pd.concat((pd.read_csv(f, sep=',', encoding='latin-1') for f in file), ignore_index=True, sort=True)
data['Period'] = '202007' #Period Column is required as string
单个文件有 40 列,但是当我通过“pd.concat”添加所有文件时,我得到 81 列(大写 40 + 小写 40 + 创建的 1 列)。
我需要最终的 output 为 41 列 - 大写/小写的 40 列 + 1 个创建的列
感谢 Sid 的 concat 帮助。
更新(数据类型):我的数据中有不同的数据类型(int、float、object)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.