簡體 English 中英

AWS數據管道與步驟功能

[英]AWS Data Pipeline vs Step Functions

原文 2019-03-08 10:50:23 2 1 amazon-web-services/ aws-step-functions/ aws-data-pipeline

我正在研究一個問題，我們打算使用EMR（SparkSQL）對數據進行多次轉換。

在瀏覽AWS Data Pipelines和AWS Step Functions的文檔后，我對每個嘗試解決的用例有些疑惑。 我環顧四周，但沒有找到兩者之間的權威比較。 有多種資源顯示我如何使用它們來安排和觸發EMR集群上的Spark作業。

是的，有很多方法可以實現相同的功能，不同之處在於細節和用例。 我甚至會提供另一種選擇:)

如果您正在進行一系列轉換並且所有這些轉換都在EMR集群上，那么您可能只需要創建具有步驟的集群，或者通過幾個步驟提交API作業。 步驟將在您的群集上按順序執行。

如果您擁有不同的數據源，或者您希望處理更復雜的方案，那么AWS Data Pipeline和AWS Step Functions都可以運行。 AWS Step Functions是實現工作流的通用方式，而Data Pipelines是用於處理Data的專用工作流。

這意味着在處理數據源和輸出時，數據管道將更好地集成，並直接使用S3，EMR，DynamoDB，Redshift或RDS等工具。 因此，對於純數據管道問題，AWS Data Pipeline可能是更好的候選者。

話雖如此，AWS Data Pipeline並不是很靈活。 如果不支持您需要的數據源，或者您想要執行某些未集成的活動，那么您需要使用shell腳本來解決問題。

另一方面，AWS Step Functions並不專業，並且與某些AWS服務和AWS Lambda具有良好的集成，這意味着您可以通過無服務器apis輕松集成任何內容。

所以它實際上取決於您需要實現的目標以及您擁有的工作負載類型。

AWS SNS與AWS步驟功能

[英]AWS SNS vs AWS Step Functions

[英]AWS Step Functions Data Limit

[英]AWS step functions vs Camunda for workflow

[英]AWS Step Functions vs Luigi for orchestration

[英]AWS Batch vs AWS Step functions for Control M migration

[英]Pass data across loop in AWS Step Functions

[英]Does AWS Step functions support binary data?

[英]Can AWS Glue call Step functions for data?

[英]AWS Data Pipeline scheduling with expressions and date functions

[英]AWS data pipeline VS lambda for EMR automation

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 AWS SNS與AWS步驟功能 AWS Step Functions 數據限制 AWS 階梯函數與 Camunda 的工作流程用於編排的 AWS Step Functions 與 Luigi 用於 Control M 遷移的 AWS Batch 與 AWS Step 函數在 AWS Step Functions 中跨循環傳遞數據 AWS Step函數是否支持二進制數據？ AWS Glue 可以為數據調用 Step 函數嗎？帶有表達式和日期函數的AWS Data Pipeline調度適用於EMR自動化的AWS數據管道VS lambda

相關標簽