繁体 English 中英

我可以在Kafka处理器中拥有本地状态吗？

[英]Can I have local state in a Kafka Processor?

原文 2018-08-09 14:43:10 7 1 java/ apache-kafka

我一直在阅读有关Kafka并发模型的内容，但是我仍然很难理解我是否可以在Kafka处理器中拥有本地状态，否则是否会以不良方式失败？

我的用例是：我有一个更新主题，我想将这些更新插入数据库中，但是我想先将它们批处理。 我将它们批处理在Processor内的Java ArrayList中，然后将它们发送并在标点调用中提交。

这会失败吗？ 我是否保证不会同时访问ArrayList？

我意识到将有多个处理器和多个ArrayList，具体取决于线程和分区的数量，但是我并不在乎。

我还意识到，如果应用程序崩溃，我将失去ArrayList，但是我不在乎是否将某些事件两次插入数据库。

在我的简单测试中，这可以正常工作，但这是正确的吗？ 如果没有，为什么？

1 个解决方案

无论您在Kafka消费者应用程序中将其用于本地状态，都由您决定。 因此，您可以保证只有当前线程/消费者才能访问阵列列表中的本地状态数据。 如果您有多个线程（每个Kafka使用者一个线程），则每个线程可以拥有自己的私有ArrayList或哈希表，以将状态存储到其中。 您还可以使用本地RocksDB数据库之类的东西来保持本地状态。

需要注意的几件事：

如果将批处理更新分批发送给数据库，那么这些更新是否与事务相关，例如，因为它们是事务的一部分？ 如果没有，您可能会遇到问题。 确保是这种情况的一种简单方法是为带有事务ID或其他一些事务唯一标识符的消息设置密钥，这样所有具有该事务ID的更新都将在一个特定分区中结束，因此食用它们的人一定会始终拥有
- 在批量更新之前，如何验证已获得所有交易？ 同样，如果您要处理事务内部的数据库更新，那么这很重要。 您可以简单地等待预定的时间以确保拥有所有更新（例如，对于您的情况，也许30秒就足够了）。 或者，您可能会发送“ EndOfTransaction”消息，其中详细说明了应获取的消息数量，以及消息本身的CRC或哈希值。 这样，当您收到消息时，可以使用它来验证您是否已拥有所有消息，也可以继续等待尚未收到的消息。
- 确保你没有犯卡夫卡你在内存中保存，直到你批处理后，并将它们发送到数据库，并已证实，通过更新成功去的消息。 这样，如果您的应用程序死了，则下次重新启动它时，它将再次获得您尚未在Kafka中提交的消息。

Kafka Streams 关闭处理器的状态存储

[英]Kafka Streams closing processor's state store

如何创建处理局部变量的注释处理器？

[英]How can I create an annotation processor that processes a Local Variable?

Kafka Streams当地的国营商店

[英]Kafka Streams local state stores

我怎样才能有一个通用的卡夫卡反序列化器

[英]How can I have a generic Deserializer for Kafka

我可以使用不同的 kafka 代理集来存储 Kafka 流应用程序的 state 吗？

[英]Can I use different set of kafka brokers for storing the state of Kafka streams application?

我们可以在全局状态存储恢复期间调用处理器吗？

[英]can we invoke the processor during global state store restoration?

无法在Kafka Streams应用程序中查询本地状态存储

[英]Cannot query local state store in Kafka Streams Application

Kafka - 本地 state 存储是否消耗应用程序内存（JVM）

[英]Kafka - Does local state store consumes application memory(JVM)

如果我在本地没有sbt，可以使用yahoo-kafka-manager吗？

[英]Can I use yahoo-kafka-manager if I don't have sbt locally?

我可以将Scala中的局部变量设置为Volatile，因为在Java中它是不可能的吗？

[英]Can I have a local var in Scala as Volatile, since in Java it is not possible?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Kafka Streams 关闭处理器的状态存储如何创建处理局部变量的注释处理器？ Kafka Streams当地的国营商店我怎样才能有一个通用的卡夫卡反序列化器我可以使用不同的 kafka 代理集来存储 Kafka 流应用程序的 state 吗？我们可以在全局状态存储恢复期间调用处理器吗？无法在Kafka Streams应用程序中查询本地状态存储 Kafka - 本地 state 存储是否消耗应用程序内存（JVM）如果我在本地没有sbt，可以使用yahoo-kafka-manager吗？我可以将Scala中的局部变量设置为Volatile，因为在Java中它是不可能的吗？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM