簡體   English   中英

將列添加到多個.csv 文件和文件名,因為您將這些.csv 文件組合成單個 dataframe

[英]Adding a column to multiple .csv files with the file name as you combine those .csv files into a single dataframe

我有 50.csv 文件組合超過 188k 行,我需要添加文件名,以便能夠跟蹤它來自哪個文件。 我在下面包含了我正在使用的代碼,它能夠將文件組合成一個 df。

df = pd.DataFrame()
for file in files:
    if file.endswith('.csv'):
        df=df.append(pd.read_csv(file), ignore_index=True)
df.head()

您快到了。 不要直接附加read_csv()的結果,而是存儲它並添加一個帶有文件名的新列

for file in files:
    if file.endswith('.csv'):
        df_new = pd.read_csv(file)
        df_new['from_file'] = file
        df = df.append(df_new, ignore_index=True)

此外,如果您的file變量實際上是文件的整個路徑,則可以使用os.path.basename(file)僅返回文件名,而不返回路徑。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM