
[英]How to achieve JobManager High Availability in a Kubernetes Flink Cluster?
[英]How to achieve JobManager High Availability in a Mesos Flink Cluster?
Flink官方文档为Standalone And Yarn Flink群集提供了Jobmanager高可用性解决方案。 但是,使用Mesos Flink群集如何实现高可用性?
我了解到Flink依靠Marathon来启动失败的JobManager,但这带来了一个问题:每次jobmanager重新启动时,都会重新部署作业。 这对于关键任务工作是不可接受的。 是否有解决此问题的方法? 还是有计划在Mesos模式下支持Flink的完整HA?
我在Flink中使用了此配置,它确实适用于两个mesos主设备和一个从属设备:
high-availability: zookeeper
high-availability.storageDir: hdfs:///flink/ha/
high-availability.zookeeper.quorum: 0.0.0.0:2181,10.32.0.3:2181,10.32.0.4:2181,10.32.0.5:2181
fs.hdfs.hadoopconf: /opt/hadoop/etc/hadoop
fs.hdfs.hdfssite: /opt/hadoop/etc/hadoop/hdfs-site.xml
recovery.zookeeper.path.mesos-workers: /mesos-workers
env.java.home: /opt/java
mesos.master: 10.32.0.2:5050,10.32.0.3:5050
另外,我在Marathon中使用了这个JSON文件:
{
"id": "flink",
"cmd": "/home/flink-1.7.2/bin/mesos-appmaster.sh -Djobmanager.heap.mb=1024 -Djobmanager.rpc.port=6123 -Drest.port=8081 -Dmesos.resourcemanager.tasks.mem=1024 -Dtaskmanager.heap.mb=1024 -Dtaskmanager.numberOfTaskSlots=2 -Dparallelism.default=2 -Dmesos.resourcemanager.tasks.cpus=1",
"cpus": 1.0,
"mem": 1024,
}
我希望它是有用的。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.