[英]How to run multiple spark jobs parallel on yarn with cluster mode?
例如,当我向纱线集群提交第一个作业时,该作业正在运行,然后提交第二个作业,第二个作业状态永远不会运行,直到第一个作业完成成功或失败。
有没有办法在集群模式下在纱线上并行运行多个火花作业?
这完全取决于您的队列设置。 如果您没有使用--queue QUEUE_NAME
明确指定您的作业队列, --queue QUEUE_NAME
纱线会在默认队列中启动它,否则(如果您在指定队列中提交作业时添加参数--queue system
)。 您可以在 YARN/Configs/Advanced/Scheduler(我使用的是yarn.scheduler.capacity.<queue-path>.maximum-applications
),参数yarn.scheduler.capacity.<queue-path>.maximum-applications
配置队列(创建新的,设置最大应用程序数量!,在队列之间拆分资源等) yarn.scheduler.capacity.<queue-path>.maximum-applications
。
另请阅读https://hadoop.apache.org/docs/r2.7.4/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.