繁体   English   中英

将列添加到多个.csv 文件和文件名,因为您将这些.csv 文件组合成单个 dataframe

[英]Adding a column to multiple .csv files with the file name as you combine those .csv files into a single dataframe

我有 50.csv 文件组合超过 188k 行,我需要添加文件名,以便能够跟踪它来自哪个文件。 我在下面包含了我正在使用的代码,它能够将文件组合成一个 df。

df = pd.DataFrame()
for file in files:
    if file.endswith('.csv'):
        df=df.append(pd.read_csv(file), ignore_index=True)
df.head()

您快到了。 不要直接附加read_csv()的结果,而是存储它并添加一个带有文件名的新列

for file in files:
    if file.endswith('.csv'):
        df_new = pd.read_csv(file)
        df_new['from_file'] = file
        df = df.append(df_new, ignore_index=True)

此外,如果您的file变量实际上是文件的整个路径,则可以使用os.path.basename(file)仅返回文件名,而不返回路径。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM