繁体 English 中英

在现有EMR上运行Scala Spark作业

[英]Running Scala Spark Jobs on Existing EMR

原文 2017-11-16 09:43:05 7 2 scala/ apache-spark/ emr/ amazon-emr

我的机器上运行的是Spark Job Aggregationfinal_2.11-0.1 jar，它的组成如下：

package deploy
    object FinalJob {
      def main(args: Array[String]): Unit = {
        val spark = SparkSession
          .builder()
          .appName(s"${this.getClass.getSimpleName}")
          .config("spark.sql.shuffle.partitions", "4")
          .getOrCreate()

    //continued code
    }
    }

当我在本地模式下运行此代码时，它运行良好，但是当我将其jar放在主节点上时将其部署在EMR群集上时，出现错误为：

ClassNotFoundException : deploy.FinalJob

我在这里想念什么？

2 个解决方案

最好的选择是将uber jar（可以使用sbt assembly插件来构建jar）部署到s3并向EMR集群添加spark步骤。 请检查： http : //docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html

尝试将其解压缩到某个文件夹，并使用以下命令jar -xvf myapp.jar查找目标/类。 如果目标类不包含您正在执行的类，则构建jar的方式存在问题。 我建议将maven组装放入包装的pom中。

在 emr 5.29.0 上运行 Scala 2.12

[英]Running scala 2.12 on emr 5.29.0

在调度程序中运行 Scala 作业

[英]Running Scala jobs in Scheduler

在 spark 中运行多个作业

[英]Running multiple jobs in spark

Python vs Scala（适用于Spark作业）

[英]Python vs Scala (for Spark jobs)

如何在Amazon EMR上运行Spark Scala代码

[英]How to run Spark Scala code on Amazon EMR

运行scala Windows火花

[英]running scala windows spark

在Spark Scala中运行SVD

[英]Running SVD in Spark Scala

火花scala运行

[英]Spark scala running

运行Scala和Spark时出错

[英]Error in running Scala and Spark

Spark作业中的Scala成员字段可见性

[英]Scala member field visibility in Spark jobs

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在 emr 5.29.0 上运行 Scala 2.12 在调度程序中运行 Scala 作业在 spark 中运行多个作业 Python vs Scala（适用于Spark作业）如何在Amazon EMR上运行Spark Scala代码运行scala Windows火花在Spark Scala中运行SVD 火花scala运行运行Scala和Spark时出错 Spark作业中的Scala成员字段可见性

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM