簡體   English   中英

如何添加 EMR Spark 步驟?

[英]How to add an EMR Spark Step?

根據文檔

對於步驟類型,選擇 Spark 應用程序。

但在 Amazon EMR -> 集群 -> mycluster -> 步驟 -> 添加步驟 -> 步驟類型中,唯一的選項是:

在此處輸入圖像描述

添加 EMR 火花步驟的方法有兩種:

- 使用command-runner.jar (自定義應用程序) 在此處輸入圖像描述

spark-submit --class org.apache.spark.examples.SparkPi /usr/lib/spark/examples/jars/spark-examples.jar 10

使用 aws cli 做同樣的事情

aws emr add-steps --cluster-id j-xxxxxxxx --steps Name="add emr step to run spark",Jar="command-runner.jar",Args=[spark-submit,--class,org.apache.spark.examples.SparkPi,/usr/lib/spark/examples/jars/spark-examples.jar,10]

- 火花應用在此處輸入圖像描述

我沒有 Spark 應用程序選項,因為我創建了 Core Hadoop 集群。

當我創建集群時,在軟件配置下,我應該選擇 Spark,然后我會在 Step 類型下擁有 Spark 應用程序選項。

您可以將 command-runner.jar 用於您的用例。 對於步驟類型,請從您擁有的選項中選擇自定義 Jar。 查看此圖像以了解詳細信息。

命令運行程序用法

您可以閱讀有關 command-runner.jar command-runner-usage 的更多信息

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM