[英]Eviction of data from Kafka key value state store
我正在使用 kafkaStreams 执行聚合,它实际上将所有聚合记录保存到 keyValue 状态存储中,针对我生成的特定键来唯一标识该聚合。 我没有使用任何 kafka 窗口进行此聚合。 所以本质上这种方法将继续监听输入数据,从而继续聚合。 现在基于密钥,我需要应用不同的逻辑从 stateStore 搜索并将我的数据移动到下游。
Kafka 的 KeyValueStateStore 给了我 4 种方法,即 all、prefixScan、range 和 get。 其中基于我生成的密钥,我发现我只能使用所有并获取。
PS 在任何时候,我的 statestore 都将包含至少十亿条记录。
有人可以建议使用键搜索到 kafka keyValue stateStore 来检索数据的最佳(性能方面)可能的方法。 或该方法的任何替代方法都值得赞赏。
更新:从 statestore 中逐出数据后,我不会删除它,而是希望使用表明是否已被逐出的标志来更新它。 这只能通过对 statestore 的读/写访问来实现,而 statestore 又只能通过管道获得,因为交互式查询只提供对 statestore 的读访问。 这就是我对卡夫卡的了解。 否则请帮忙。
我认为您应该使用 Apache Spark 流式传输来使用它
我不确定这是否可以在 Kafka 中完成
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.