繁体 English 中英

处理(Drop and Log) Kafka 生产者发布的坏数据，这样Spark (Java) Consumer 不会将其存储在HDFS 中

[英]Handle(Drop and Log) bad data published by Kafka producer , such that Spark (Java) Consumer doesn't store it in HDFS

原文 2020-03-17 15:03:03 2 1 java/ apache-spark/ exception/ error-handling/ apache-kafka

目前，我正在使用 Java 内置的 Spark Consumer 来读取 Kafka Producer 发布的记录（json）并将其存储在 hdfs 中。 如果假设我的记录具有以下属性（id、名称、公司、发布日期），目前，我正在处理异常，如果缺少其中一个属性，则程序会抛出一个运行时异常，并显示日志消息中的一个该属性丢失，但问题是，由于异常，整个火花作业完全停止。 我想处理那些坏记录，通过避免这种情况，而不是停止整个 spark 作业，程序会删除并记录这些坏记录，而不是抛出异常。

1 个解决方案

答案将基于意见。 这是我会做的，

不要在日志文件中记录拒绝，因为这可能很大并且您可能需要重新处理它们。 而是为拒绝原因的拒绝记录创建另一个数据集。 您的过程将产生 2 个数据集 - 好的和拒绝的。

尽管有可能，但不应将异常用于代码的控制流。 我会使用谓词/过滤器/IF 条件的想法，它会检查数据并拒绝那些不符合谓词/过滤器/IF 条件的数据。

如果您使用异常，则将其绑定到处理单个记录而不是整个作业。 最好避免这种想法。

Consumer Producer在Java中不起作用

[英]Consumer Producer doesn't work in java

Kafka Messages-Java生产者和消费者客户端

[英]Kafka Messages - Producer & Consumer Client in Java

Kafka Java生产者和使用者，其ACL启用了主题

[英]Kafka java producer and consumer with ACL enabled with topic

Spark Kafka 流不会在工作节点上分配消费者负载

[英]Spark Kafka streaming doesn't distribute consumer load on worker nodes

Kafka生产者和消费者延迟

[英]Kafka producer and consumer delay

消费者无法使用Java中的简单生产者/消费者/队列代码工作

[英]Consumer doesn't work in my simple producer/consumer/queue code in Java

Apache Kafka生产者不存储数据

[英]Apache kafka producer does not store data

如何找回Kafka生产者和消费者配置（Java API）？

[英]How to get back Kafka producer and consumer configuration (Java API)?

具有4个分区的单一生产者的多用户设置Kafka Java

[英]Multiple Consumer setup for Single Producer with 4 partitions Kafka Java

Kafka：Java Producer发送消息后，控制台消费者上没有看到任何消息

[英]Kafka: No message seen on console consumer after message sent by Java Producer

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Consumer Producer在Java中不起作用 Kafka Messages-Java生产者和消费者客户端 Kafka Java生产者和使用者，其ACL启用了主题 Spark Kafka 流不会在工作节点上分配消费者负载 Kafka生产者和消费者延迟消费者无法使用Java中的简单生产者/消费者/队列代码工作 Apache Kafka生产者不存储数据如何找回Kafka生产者和消费者配置（Java API）？具有4个分区的单一生产者的多用户设置Kafka Java Kafka：Java Producer发送消息后，控制台消费者上没有看到任何消息

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM