繁体 English 中英

Kafka KStream-拓扑设计

[英]Kafka KStream - topology design

原文 2016-09-04 18:03:13 2 1 java/ apache-kafka/ apache-kafka-streams

我的流是键/值对，我想将它们保存为“原始”并在60秒内聚合到数据库。 最初我是这样做的：

                       ->foreach
                     /
kStreamBuilder.stream->aggregateBy->process

但后来我发现

一种。 .aggregateby()仅返回其匹配的对（我需要所有它们-匹配或其他）
湾 我可以在.process()阶段使用HashMap达到相同的聚合效果。 然后，当.punctuate()调用时，我将所有k / v对写入数据库。

因此，最终的拓扑变为：

kStreamBuilder.stream->foreach
kStreamBuilder.stream->process

问题：

这是一种“合理”的方式来获得将所有kv对写入匹配的结果吗？ （通过foreach的所有值，以及通过进程的任何对+其余值）
我是否需要发送它之前（在某种程度上）除以原始流.foreach()和.process()或者是足以完成上述？

1 个解决方案

DSL层中的聚合设计用于“增量聚合”，即，当前聚合结果加上要“添加”的单个新值。 如果要一次访问60秒窗口的所有“原始记录”，则需要使用Processor API。

如果您有两个下游运算符，则无需执行任何操作。 记录将自动转发到两者。 但是，请记住，它们不会被复制，即，两个下游运算符将为每个记录看到相同的Java对象！

单元测试使用 kstream 连接的 kafka 拓扑

[英]Unit testing a kafka topology that's using kstream joins

kafka KStream - 采用n秒计数的拓扑

[英]kafka KStream - topology to take n-second counts

Kafka KStream - 衡量消费者滞后

[英]Kafka KStream - measuring consumer lag

Kafka KStream-在窗口中使用AbstractProcessor

[英]Kafka KStream - using AbstractProcessor with a Window

Kafka KStream-严重的启动延迟

[英]Kafka KStream - significant startup delay

Kafka中的动态流拓扑

[英]Dynamic Streams Topology in Kafka

试图理解 Kafka 的 KStream 概念

[英]Trying to understand Kafka's KStream concept

卡夫卡+风暴拓扑与微服务

[英]kafka + storm topology vs microservices

Scala - 如何过滤 KStream (Kafka Streams)

[英]Scala - How to filter KStream (Kafka Streams)

使用 DSL KStream 到 KTable 的 Kafka Tombstoning

[英]Kafka Tombstoning with a DSL KStream to KTable Transformation

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 单元测试使用 kstream 连接的 kafka 拓扑 kafka KStream - 采用n秒计数的拓扑 Kafka KStream - 衡量消费者滞后 Kafka KStream-在窗口中使用AbstractProcessor Kafka KStream-严重的启动延迟 Kafka中的动态流拓扑试图理解 Kafka 的 KStream 概念卡夫卡+风暴拓扑与微服务 Scala - 如何过滤 KStream (Kafka Streams) 使用 DSL KStream 到 KTable 的 Kafka Tombstoning

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM