繁体   English   中英

读取和写入Amazon s3存储桶中的文件

[英]Read and write to a file in Amazon s3 bucket

我需要从Amazon S3存储桶读取一个大文件(> 15mb)(例如sample.csv )。 然后,我需要处理sample.csv存在的数据,并将其继续写入S3存储桶中的另一个目录。 我打算使用AWS Lambda函数运行我的Java代码。

第一步,我开发了可以在本地系统上运行的Java代码。 Java代码从S3存储桶中读取sample.csv文件,我使用put方法将数据写回到S3存储桶中。 但是我发现只有最后一行被处理并放回去了。

Region clientRegion = Region.Myregion;    
AwsBasicCredentials awsCreds = AwsBasicCredentials.create("myAccessId","mySecretKey");    
S3Client s3Client = S3Client.builder().region(clientRegion).credentialsProvider(StaticCredentialsProvider.create(awsCreds)).build();    
ResponseInputStream<GetObjectResponse> s3objectResponse = s3Client.getObject(GetObjectRequest.builder().bucket(bucketName).key("Input/sample.csv").build());    
BufferedReader reader = new BufferedReader(new InputStreamReader(s3objectResponse));    
String line = null;
while ((line = reader.readLine()) != null) {
                s3Client.putObject(PutObjectRequest.builder().bucket(bucketName).key("Test/Testout.csv").build(),RequestBody.fromString(line));
}

示例:sample.csv包含

1,sam,21,java,beginner;
2,tom,28,python,practitioner;
3,john,35,c#,expert.

我的输出应该是

1,mas,XX,java,beginner;
2,mot,XX,python,practitioner;
3,nhoj,XX,c#,expert. 

但是在Testout.csv仅写入了3,nhoj,XX,c#,expert

putObject()方法创建一个Amazon S3对象。

无法附加或修改S3对象,因此每次执行while循环时,它都会创建一个新的Amazon S3对象。

相反,我建议:

  • 将源文件从Amazon S3 下载到本地磁盘(将GetObject()destinationFile一起使用以下载到磁盘)
  • 处理文件并输出到本地文件
  • 将输出文件上传到Amazon S3存储桶( 方法

这会将AWS代码与您的处理代码分开,这应该更易于维护。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM