繁体 English 中英

我应该使用哪种AWS服务来处理大型文本文件？

[英]Which AWS service should I use to process large text file?

原文 2018-06-24 18:38:54 9 1 amazon-web-services/ amazon-s3/ aws-lambda/ amazon-kinesis

我有一个用例，需要读取一个非常大的文本文件，其中最多可以包含一百万条记录。 对于每条记录，我必须执行一些验证，然后将其转换为其他JSON，然后将其推送到SNS主题。 我不需要顺序阅读它们，因此可以使用并行性。 一种选择是将文件放入S3存储桶中，然后使用lambda处理文件，该文件将记录（散开地）散发到多个lambda函数中，这些函数负责转换（和验证），然后将其推送到SNS。 另一种选择是使用运动学流，并使用多个lambda执行相同的操作。 使用运动学流的多个Lambda

理想的方法是什么？

S3-> Lambda->多个Lambdas-> SNS
Kinesis->多个Lambda（或Lambda->多个Lambdas-> SNS）

1 个解决方案

您可能需要研究AWS Glue。 该服务可以对S3中存储的大多数内容执行ETL，因此它可以避免您自己执行此操作的麻烦。 结合S3触发Lambda，这可能是一个有趣的选择？

编辑：如果可以使用RegExs解析文件，也许尝试Athena？ 雅典娜相对便宜，可以轻松处理更大的文件。

如果记录的长度可预测，则可以使用Range请求将文件传递给Lambda之前对文件进行分割，以防止运行时间过长。

另外，您是否尝试过使用Lambda解析和分块文件？ 100万条记录并不多，简单地将行拆分和处理（大块）交给验证（或SNS）就不成问题。

我应该使用哪种服务在 AWS 上运行计划任务？

[英]Which service should I use to run scheduled task on AWS?

我可以使用哪种AWS服务每周有效地处理大量S3数据？

[英]What AWS service can I use to efficiently process large amounts of S3 data on a weekly basis?

我应该使用哪个 aws 数据库？

[英]Which aws database should I use?

我应该在哪个 AWS 服务中部署我的 react 应用程序

[英]In which AWS service should I deploy my react app

我应该使用哪些函数来读取 aws lambda 日志

[英]Which functions should I use to read aws lambda log

使用哪个 aws 消息服务

[英]Which aws messaging service to use

如何为Mongodb使用AWS服务以及哪个服务？

[英]How to use AWS service for Mongodb and which service?

我应该在 aws lambda 上批量处理作业吗？

[英]Should I process job in batch on aws lambda?

我应该如何将文件发布到AWS Lambda函数，处理它，并将文件返回给客户端？

[英]How should I post a file to AWS Lambda function, process it, and return a file to the client?

使用哪个AWS服务来部署后端？

[英]Which AWS service to use to deploy Backend?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 我应该使用哪种服务在 AWS 上运行计划任务？我可以使用哪种AWS服务每周有效地处理大量S3数据？我应该使用哪个 aws 数据库？我应该在哪个 AWS 服务中部署我的 react 应用程序我应该使用哪些函数来读取 aws lambda 日志使用哪个 aws 消息服务如何为Mongodb使用AWS服务以及哪个服务？我应该在 aws lambda 上批量处理作业吗？我应该如何将文件发布到AWS Lambda函数，处理它，并将文件返回给客户端？使用哪个AWS服务来部署后端？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM