[英]Adding a column to multiple .csv files with the file name as you combine those .csv files into a single dataframe
我有 50.csv 文件组合超过 188k 行,我需要添加文件名,以便能够跟踪它来自哪个文件。 我在下面包含了我正在使用的代码,它能够将文件组合成一个 df。
df = pd.DataFrame()
for file in files:
if file.endswith('.csv'):
df=df.append(pd.read_csv(file), ignore_index=True)
df.head()
您快到了。 不要直接附加read_csv()
的结果,而是存储它并添加一个带有文件名的新列
for file in files:
if file.endswith('.csv'):
df_new = pd.read_csv(file)
df_new['from_file'] = file
df = df.append(df_new, ignore_index=True)
此外,如果您的file
变量实际上是文件的整个路径,则可以使用os.path.basename(file)
仅返回文件名,而不返回路径。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.