[英]how to load multiple files in a folder from s3 to Python Notebooks
我在 s3 上的一個文件夾中有一系列 s3 文件,它們的格式如下所示:
aac0202-2121-41.csv
aac0202-2121-42.csv
aac0202-2121-43.csv
aac0202-2121-44.csv
...aac0202-2121-70.csv
它們都有相同的列,我正在嘗試 read_csv 並將它們聚合在一起。
該文件應該是一個包含 41 到 70 的大文件。
我當前的代碼是這樣的,有沒有更有效的方法或更好的方法來做到這一點?
for number in arange(41, 71, 1):
df = df.concat([df, pd.read_csv('s3://ap/data/tm/aac0202-2121-%s.csv'%number)])
df
我希望每個文件在連接期間只出現一次。 所以它只是組合 41、42、43..直到 70。
嘗試:
df_list = []
for number in arange(41, 71, 1):
df = pd.read_csv('s3://ap/data/tm/aac0202-2121-%s.csv'%number)
df_list.append(df)
df_final = pd.concat(df_list)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.