[英]Adding a column to multiple .csv files with the file name as you combine those .csv files into a single dataframe
我有 50.csv 文件組合超過 188k 行,我需要添加文件名,以便能夠跟蹤它來自哪個文件。 我在下面包含了我正在使用的代碼,它能夠將文件組合成一個 df。
df = pd.DataFrame()
for file in files:
if file.endswith('.csv'):
df=df.append(pd.read_csv(file), ignore_index=True)
df.head()
您快到了。 不要直接附加read_csv()
的結果,而是存儲它並添加一個帶有文件名的新列
for file in files:
if file.endswith('.csv'):
df_new = pd.read_csv(file)
df_new['from_file'] = file
df = df.append(df_new, ignore_index=True)
此外,如果您的file
變量實際上是文件的整個路徑,則可以使用os.path.basename(file)
僅返回文件名,而不返回路徑。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.