如何在 EMR 步驟 function 中硬編碼集群 ID

Question

我正在嘗試創建 EMR 步進函數，我想在其中指定始終運行的 EMR 集群。 我在網上遇到的所有示例都告訴您如何創建一個集群，然后在工作完成后終止它。

我的 EMR 步驟 function 如下：

{
  "Comment": "My EMR Step",
  "StartAt": "Config_Meta",
  "States": {
    "Config_Meta": {
      "Type": "Task",
      "Resource": "arn:aws:states:::elasticmapreduce:addStep.sync",
      "InputPath": "$",
      "Parameters": {
        "ClusterId.$": "j-4ABCDEFGHIK",
        "Step": {
          "Name": "Config_Meta",
          "ActionOnFailure": "CONTINUE",
          "HadoopJarStep": {
            "Jar": "command-runner.jar",
            "Args": [
              "bash",
              "-c",
              "source /home/hadoop/.bashrc && spark-submit --deploy-mode cluster --executor-cores 4 --driver-cores 4 --executor-memory 19g --driver-memory 19g --num-executors 27 --conf spark.default.parallelism=100 --conf spark.yarn.executor.memoryOverhead=9g --conf spark.shuffle.io.retryWait=180s --conf spark.network.timeout=500s --conf maximizeResourceAllocation=true s3://path/config_meta.py"
            ]
          }
        }
      },
      "End": true
    }
  }
}

我在"ClusterId.$": "j-4ABCDEFGHIK"中指定了我的集群 ID。 但是，當我嘗試保存它時出現以下錯誤。

字段“ClusterId.$”的值必須是有效的 JSONPath

有什么辦法可以克服這個嗎？

Answer 1

解決方案是從集群變量定義中刪除$ 。

改變

"ClusterId.$": "j-4ABCDEFGHIK"

至

"ClusterId": "j-4ABCDEFGHIK"

如何在 EMR 步驟 function 中硬編碼集群 ID

問題描述

1 個解決方案

解決方案1
1 已采納 2021-05-23 22:50:23

如何在 EMR 步驟 function 中硬編碼集群 ID

問題描述

1 個解決方案

解決方案1 1 已采納 2021-05-23 22:50:23

解決方案1
1 已采納 2021-05-23 22:50:23