Spark提交在紗線集群模式下截斷參數

Question

我使用以下命令在集群部署模式下在紗線集群上運行火花應用程序

spark-submit --conf spark.executor.memory=24g --conf spark.master=yarn --conf spark.submit.deployMode=cluster --conf spark.executor.extraJavaOptions=-Dfile.encoding=UTF-8 --conf spark.files=file:///opt/configurations/app.conf --class com.example.HelloWorld --queue sample_q file:///opt/jars/example.jar '{"sample":{}}'

此命令未將整個參數傳遞給 HelloWorld 類。 傳遞的主要方法參數： {"sample":{預期的主要方法參數： {"sample":{}}

相同的命令在客戶端部署模式下正常運行

spark-submit --conf spark.executor.memory=24g --conf spark.master=yarn --conf spark.submit.deployMode=client --conf spark.executor.extraJavaOptions=-Dfile.encoding=UTF-8 --conf spark.files=file:///opt/configurations/app.conf --class com.example.HelloWorld --queue sample_q file:///opt/jars/example.jar '{"sample":{}}'

在檢查 yarn 工作節點中的launch_container.sh腳本后，發現該命令中還包含截斷的字符串（ --arg '{\\"sample\\":{' ）

火花版本：2.3

Hadoop 版本：2.7.3

Answer 1

Yarn 將{{和}}視為參數擴展字符，因此任何出現都被視為環境變量並替換為相應的值。 因為沒有環境變量。

這會導致集群部署模式出現問題，因為驅動程序在紗線集群中運行。

參考： YarnApplicationConstants

Spark提交在紗線集群模式下截斷參數

問題描述

1 個解決方案

解決方案1
0 已采納 2021-11-30 03:56:56

Spark提交在紗線集群模式下截斷參數

問題描述

1 個解決方案

解決方案1 0 已采納 2021-11-30 03:56:56

解決方案1
0 已采納 2021-11-30 03:56:56