繁体 English 中英

如何在Spark中使用Kafka Consumer

[英]How to use Kafka consumer in spark

原文 2017-01-19 14:57:27 4 1 scala/ apache-spark/ apache-kafka/ kafka-consumer-api

我正在使用spark 2.1和Kafka 0.10.1。

我想通过每天阅读Kafka中特定主题的全部数据来处理数据。

对于火花流，我知道createDirectStream仅需要包含主题列表和一些配置信息作为参数。

但是，我意识到createRDD必须包含所有主题，分区和偏移信息。

我想使批处理像流式处理一样方便。

可能吗？

1 个解决方案

我建议您从Cloudera阅读本文。

本示例向您展示如何仅一次从Kafka获取数据。 由于ACID架构，您将把偏移量保留在postgres中。

因此，我希望能解决您的问题。

如果Kafka Consumer失败（Spark Job），如何获取Kafka Consumer提交的最后一个偏移量。（斯卡拉）

[英]If Kafka Consumer fails (Spark Job), how to fetch the last offset committed by Kafka Consumer. (Scala)

Kafka的Spark流：如何从Kafka使用者DStream获得主题名称？

[英]Spark streaming for Kafka: How to get the topic name from Kafka consumer DStream?

如何测试卡夫卡消费者

[英]How to Test Kafka Consumer

使用Spark Streaming创建Kafka使用者

[英]Creating a kafka consumer using spark streaming

Kafka和Spark Streaming简单生产者消费者

[英]Kafka and Spark Streaming Simple Producer Consumer

Spark Kafka Consumer不使用主题消息

[英]Spark Kafka Consumer not consuming messages from topic

Kafka 不是带有 kafka 消费者的 spark 应用程序包错误的成员

[英]Kafka not a member of package error in spark app with kafka consumer

Spark消费者未阅读Kafka生产者消息Scala

[英]Spark consumer doesn't read Kafka producer messages Scala

卡夫卡中的Spark 1.6 Streaming消费者阅读偏移量停留在createDirectStream上

[英]Spark 1.6 Streaming consumer reading in kafka offset stuck at createDirectStream

NoSuchMethodError：org.apache.spark.sql.kafka010.consumer

[英]NoSuchMethodError: org.apache.spark.sql.kafka010.consumer

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如果Kafka Consumer失败（Spark Job），如何获取Kafka Consumer提交的最后一个偏移量。（斯卡拉） Kafka的Spark流：如何从Kafka使用者DStream获得主题名称？如何测试卡夫卡消费者使用Spark Streaming创建Kafka使用者 Kafka和Spark Streaming简单生产者消费者 Spark Kafka Consumer不使用主题消息 Kafka 不是带有 kafka 消费者的 spark 应用程序包错误的成员 Spark消费者未阅读Kafka生产者消息Scala 卡夫卡中的Spark 1.6 Streaming消费者阅读偏移量停留在createDirectStream上 NoSuchMethodError：org.apache.spark.sql.kafka010.consumer

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM