繁体   English   中英

如何使用集群模式在纱线上并行运行多个火花作业?

[英]How to run multiple spark jobs parallel on yarn with cluster mode?

例如,当我向纱线集群提交第一个作业时,该作业正在运行,然后提交第二个作业,第二个作业状态永远不会运行,直到第一个作业完成成功或失败。

有没有办法在集群模式下在纱线上并行运行多个火花作业?

这完全取决于您的队列设置。 如果您没有使用--queue QUEUE_NAME明确指定您的作业队列, --queue QUEUE_NAME纱线会在默认队列中启动它,否则(如果您在指定队列中提交作业时添加参数--queue system )。 您可以在 YARN/Configs/Advanced/Scheduler(我使用的是yarn.scheduler.capacity.<queue-path>.maximum-applications ),参数yarn.scheduler.capacity.<queue-path>.maximum-applications配置队列(创建新的,设置最大应用程序数量!,在队列之间拆分资源等) yarn.scheduler.capacity.<queue-path>.maximum-applications

另请阅读https://hadoop.apache.org/docs/r2.7.4/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM