![](/img/trans.png)
[英]Is there a way to read from specific offset in a Kafka stream from a Spark streaming job?
[英]Spark streaming job stuck if some Kafka nodes time offset is not synchronized
我们有一个火花流式传输作业,它从Gnip API读取并将推文发送到Kafka集群。
使用Cloudera Manager安装Kafka群集。
有时,cloudera管理器会为某些Kafka节点显示错误的运行状况消息。 不良健康消息与NTP服务有关。 某些节点突然与NTP服务器不同步。
一旦发生这种情况,Spark流媒体作业就会停滞不前,很多作业都会在没有处理的情况下排队等待很长时间。
为什么Kafka节点与NTP服务器的同步会影响火花流作业中的Kafka生产者?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.