簡體 English 中英

我應該使用哪種AWS服務來處理大型文本文件？

[英]Which AWS service should I use to process large text file?

原文 2018-06-24 18:38:54 0 1 amazon-web-services/ amazon-s3/ aws-lambda/ amazon-kinesis

我有一個用例，需要讀取一個非常大的文本文件，其中最多可以包含一百萬條記錄。 對於每條記錄，我必須執行一些驗證，然后將其轉換為其他JSON，然后將其推送到SNS主題。 我不需要順序閱讀它們，因此可以使用並行性。 一種選擇是將文件放入S3存儲桶中，然后使用lambda處理文件，該文件將記錄（散開地）散發到多個lambda函數中，這些函數負責轉換（和驗證），然后將其推送到SNS。 另一種選擇是使用運動學流，並使用多個lambda執行相同的操作。 使用運動學流的多個Lambda

理想的方法是什么？

S3-> Lambda->多個Lambdas-> SNS
Kinesis->多個Lambda（或Lambda->多個Lambdas-> SNS）

1 個解決方案

您可能需要研究AWS Glue。 該服務可以對S3中存儲的大多數內容執行ETL，因此它可以避免您自己執行此操作的麻煩。 結合S3觸發Lambda，這可能是一個有趣的選擇？

編輯：如果可以使用RegExs解析文件，也許嘗試Athena？ 雅典娜相對便宜，可以輕松處理更大的文件。

如果記錄的長度可預測，則可以使用Range請求將文件傳遞給Lambda之前對文件進行分割，以防止運行時間過長。

另外，您是否嘗試過使用Lambda解析和分塊文件？ 100萬條記錄並不多，簡單地將行拆分和處理（大塊）交給驗證（或SNS）就不成問題。

我應該使用哪種服務在 AWS 上運行計划任務？

[英]Which service should I use to run scheduled task on AWS?

我可以使用哪種AWS服務每周有效地處理大量S3數據？

[英]What AWS service can I use to efficiently process large amounts of S3 data on a weekly basis?

我應該使用哪個 aws 數據庫？

[英]Which aws database should I use?

我應該在哪個 AWS 服務中部署我的 react 應用程序

[英]In which AWS service should I deploy my react app

我應該使用哪些函數來讀取 aws lambda 日志

[英]Which functions should I use to read aws lambda log

使用哪個 aws 消息服務

[英]Which aws messaging service to use

如何為Mongodb使用AWS服務以及哪個服務？

[英]How to use AWS service for Mongodb and which service?

我應該在 aws lambda 上批量處理作業嗎？

[英]Should I process job in batch on aws lambda?

我應該如何將文件發布到AWS Lambda函數，處理它，並將文件返回給客戶端？

[英]How should I post a file to AWS Lambda function, process it, and return a file to the client?

使用哪個AWS服務來部署后端？

[英]Which AWS service to use to deploy Backend?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 我應該使用哪種服務在 AWS 上運行計划任務？我可以使用哪種AWS服務每周有效地處理大量S3數據？我應該使用哪個 aws 數據庫？我應該在哪個 AWS 服務中部署我的 react 應用程序我應該使用哪些函數來讀取 aws lambda 日志使用哪個 aws 消息服務如何為Mongodb使用AWS服務以及哪個服務？我應該在 aws lambda 上批量處理作業嗎？我應該如何將文件發布到AWS Lambda函數，處理它，並將文件返回給客戶端？使用哪個AWS服務來部署后端？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM