簡體 English 中英

Spark提交作業在集群模式下失敗，但在Java中可用於本地HDFS中的copyToLocal

[英]Spark submit job fails for cluster mode but works in local for copyToLocal from HDFS in java

原文 2018-06-16 21:34:25 7 1 java/ apache-spark/ hdfs/ spark-streaming/ spark-submit

我正在運行Java代碼，以在Spark提交中使用Spark集群模式將文件從HDFS復制到本地。 作業在本地運行時運行正常，但在群集模式下失敗。 它拋出一個java.io.exeception：目標/ mypath /是一個目錄。

我不明白為什么它在群集中失敗。 但是我在本地沒有收到任何例外。

1 個解決方案

這是因為在第一種情況下（本地），您的驅動程序與運行整個Spark作業的計算機位於同一台計算機上。 在第二種情況下（集群），驅動程序被運送到您的一個工作人員並從那里執行該過程。

通常，當您要以集群模式運行Spark作業並且需要預處理本地文件（例如JSON，XML等）時，需要使用以下語句將它們與可執行文件一起--files <myfile> 。 然后，在驅動程序中，您將可以看到該特定文件。 如果要包括多個文件，請將它們用逗號(,)分隔。

當您要添加一些jar依賴項時，方法是相同的，您需要使用--jars <myJars> 。

有關此的更多詳細信息，請檢查此線程。

如何在不使用spark-submit的情況下將java程序中的spark作業提交到獨立的spark集群？

[英]How to submit spark job from within java program to standalone spark cluster without using spark-submit?

在HDFS上重命名文件在本地模式下工作，但不在群集模式下工作

[英]Renaming a file on HDFS works in local mode but not in cluster mode

Spark 在 Yarn Cluster 模式下提交，並將配置文件放入 HDFS 問題

[英]Spark submit on Yarn Cluster mode with config file put into HDFS issue

本地 microK8 的 Kubernetes 集群上的 spark-submit 失敗：java.security.cert.CertPathValidatorException

[英]spark-submit on local microK8's Kubernetes cluster fails with: java.security.cert.CertPathValidatorException

從本地 spark-submit 檢查遠程 HDFS 上是否存在文件

[英]Check if file exists on remote HDFS from local spark-submit

從 Java 提交 Azure 突觸中的 Spark 作業

[英]Submit Spark job in Azure Synapse from Java

Unable to submit a spark job on spark cluster on docker

[英]Unable to submit a spark job on spark cluster on docker

在集群模式下使用 Java 讀取保存在本地的 Spark 中的 CSV 文件

[英]Read CSV file in Spark kept in local using Java in cluster mode

使用Java和Spark從本地圖像到HDFS寫入序列文件

[英]Writing a sequence file from an image in local to HDFS using Java and Spark

無法從 Java 應用程序連接到本地 Spark 集群

[英]Cannot connect to local spark cluster from Java application

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在不使用spark-submit的情況下將java程序中的spark作業提交到獨立的spark集群？在HDFS上重命名文件在本地模式下工作，但不在群集模式下工作 Spark 在 Yarn Cluster 模式下提交，並將配置文件放入 HDFS 問題本地 microK8 的 Kubernetes 集群上的 spark-submit 失敗：java.security.cert.CertPathValidatorException 從本地 spark-submit 檢查遠程 HDFS 上是否存在文件從 Java 提交 Azure 突觸中的 Spark 作業 Unable to submit a spark job on spark cluster on docker 在集群模式下使用 Java 讀取保存在本地的 Spark 中的 CSV 文件使用Java和Spark從本地圖像到HDFS寫入序列文件無法從 Java 應用程序連接到本地 Spark 集群

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM