簡體 English 中英

從 S3 復制有限數量的文件？

[英]Copy limited number of files from S3?

原文 2020-10-09 21:39:00 8 2 amazon-web-services/ amazon-s3

我們正在使用 S3 存儲桶來存儲越來越多的 JSON 小文件（每個約 1KB），其中包含一些與構建相關的數據。 我們的部分管道涉及從 S3 復制這些文件並將它們放入 memory 以執行一些操作。

該復制操作是通過 S3 cli 工具命令完成的，如下所示：

aws s3 cp s3://bucket-path ~/some/local/path/ --recursive --profile dev-profile

問題是 S3 上的 json 文件數量越來越大，因為每天都在制作更多文件。 由於文件非常小，它甚至無法接近 S3 存儲桶的容量。 但是，實際上，沒有必要復制所有這些 JSON 文件。 實際上，系統只復制最近的 100 個左右就安全了。 但我們確實希望保留舊的用於其他目的。

所以我的問題歸結為：是否有一種干凈的方法可以從 S3 復制特定數量的文件（可能按最近排序）？ 我們可以在 S3 存儲桶上設置某種修剪策略來刪除早於 X 天的文件嗎？

2 個解決方案

您可以將生命周期策略設置為 S3 存儲桶，這將在一段時間后刪除它們。
要僅復制幾天前的對象，您需要編寫一個腳本

AWS CLI 中的aws s3 sync命令聽起來非常適合您的需求。

它將僅復制自上次同步以來新建或修改的文件。 然而，這意味着目的地將需要保留“舊”文件的副本，以便它們不會被再次復制。

或者，您可以編寫一個腳本（例如在 Python 中）列出 S3 中的對象，然后僅復制自上次運行副本以來添加的對象。

將文件從 ec2 復制到 s3

[英]Copy files from ec2 to s3

從 S3 復制到具有不同日期的 GCS 文件

[英]Copy from S3 to GCS files with different date

將文件從 S3 SignedURL 復制到 GCS Signed URL

[英]Copy Files from S3 SignedURL to GCS Signed URL

將 json 文件從一個 s3 存儲桶復制到另一個 s3 存儲桶時，無法識別 Json 文件？

[英]Json file is not recognising when copy json files from one s3 bucket to another s3 bucket?

更快地復制 S3 文件的方法

[英]Faster way to Copy S3 files

將 300 萬個 S3 文件復制到特定文件夾

[英]Copy 3 million S3 files to specific folders

將文件從一個 AWS 帳戶的 S3 存儲桶復制到另一個 AWS 帳戶的 S3 存儲桶 + 使用 NodeJS

[英]Copy files from one AWS account's S3 bucket to another AWS account's S3 bucket + using NodeJS

將文件復制並合並到另一個 S3 存儲桶

[英]Copy and Merge files to another S3 bucket

將文件從 AWS S3 復制到 Snowflake 表 - 執行復制並處理 0 個文件

[英]Copying files from AWS S3 to Snowflake Table - Copy executed with 0 files processed

AWS Lambda 嘗試將文件從 S3 存儲桶復制到另一個 S3 存儲桶時出現無效存儲桶名稱錯誤

[英]Invalid bucket name error when AWS Lambda tries to copy files from an S3 bucket to another S3 bucket

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 將文件從 ec2 復制到 s3 從 S3 復制到具有不同日期的 GCS 文件將文件從 S3 SignedURL 復制到 GCS Signed URL 將 json 文件從一個 s3 存儲桶復制到另一個 s3 存儲桶時，無法識別 Json 文件？更快地復制 S3 文件的方法將 300 萬個 S3 文件復制到特定文件夾將文件從一個 AWS 帳戶的 S3 存儲桶復制到另一個 AWS 帳戶的 S3 存儲桶 + 使用 NodeJS 將文件復制並合並到另一個 S3 存儲桶將文件從 AWS S3 復制到 Snowflake 表 - 執行復制並處理 0 個文件 AWS Lambda 嘗試將文件從 S3 存儲桶復制到另一個 S3 存儲桶時出現無效存儲桶名稱錯誤

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM