简体   繁体   English

从 Microsoft CSV 读取大数据并写入 AWS 中的 Microsoft Excel 的策略

[英]Strategies reading large data from Microsoft CSV and writing to Microsoft Excel in AWS

Kindly assist in deciding the strategy to do Extraction, Transformation and Loading (ETL) work flow with Amazon AWS offerings.请协助确定使用 Amazon AWS 产品进行提取、转换和加载 (ETL) 工作流程的策略。 I am a newbie in Amazon Cloud.我是亚马逊云的新手。 My use case is to read thousands of record rows from Microsoft CSV file.我的用例是从 Microsoft CSV 文件中读取数千行记录。 My intention is to write out this file into Microsoft Excel document.我的意图是将此文件写入 Microsoft Excel 文档。 I want to store this excel file in single piece within S3 bucket as an object.我想将此 excel 文件以 object 的形式存储在 S3 存储桶中。 Currently, I am doing this proof of concept with AWS Lambda.目前,我正在使用 AWS Lambda 进行此概念验证。 My issue is /tmp size is exceeding beyond 512 MB even if I select 6 GB RAM size in lambda specification.我的问题是 /tmp 大小超过 512 MB,即使我在 lambda 规范中使用 select 6 GB RAM 大小。 I do not do any disk operation.我不做任何磁盘操作。 I read all of S3 csv file content once, in RAM and write out to excel, in RAM.我在 RAM 中读取了所有 S3 csv 文件内容一次,并在 RAM 中写入 excel。

You should consider using aws glue for large volume data transformations.您应该考虑使用 aws 胶水进行大容量数据转换。 Lambda may be Ill suited to the task Lambda 可能不适合这项任务

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM