簡體   English   中英

在 S3 中將多個 CSV 文件合並到一個文件中

[英]Merging multiple CSV files into a single file in S3

我希望在 S3 中獲取一些文件並將它們全部合並到一個大文件中(所有文件都有相同的列)。 是否可以在不下載文件的情況下實現這一目標? 使用 Pyhton 直接在 S3 上? 不使用 ECS/Lambda。

我已經看到“UploadPartCopy”和“UploadPart”可能會有所幫助,盡管我不確定。

我會注意到文件大小可能會有所不同,從 500KB 到 27MB。

曾經通過從 S3 獲取文件並連接到一個大 DataFrame 中然后再次上傳到 S3 來執行此操作。 這工作得很好,但機器開始崩潰,因為它有太多的文件......

謝謝

我希望在 S3 中獲取一些文件並將它們全部合並到一個大文件中(所有文件都有相同的列)。 是否可以在不下載文件的情況下實現這一目標? 使用 Pyhton 直接在 S3 上? 不使用 ECS/Lambda。

不,這是不可能的。 S3 根本不為您運行代碼,它只是存儲文件。 您根本無法在 S3 或任何其他編程語言上運行 Python 代碼。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM