繁体 English 中英

如何在批处理模式下使用Spark从Kafka主题加载所有记录

[英]How to load all records from kafka topic using spark in batch mode

原文 2019-06-21 10:44:26 9 1 apache-spark/ apache-kafka/ apache-spark-sql/ kafka-consumer-api

我想使用spark从kafka主题加载所有记录，但是我看到的所有示例都在使用spark流。 我怎么能只一次从fwom kafka加载消息？

1 个解决方案

确切的步骤在官方文档中列出，例如：

val df = spark
  .read
  .format("kafka")
  .option("kafka.bootstrap.servers", "host1:port1,host2:port2")
  .option("subscribePattern", "topic.*")
  .option("startingOffsets", "earliest")
  .option("endingOffsets", "latest")
  .load()

但是，如果源是连续流，则“所有记录”的定义会很差，因为结果取决于执行查询时的时间点。

另外，您应记住，并行性受Kafka主题的分区限制，因此必须注意不要使群集不堪重负。

如何从Spark Streaming开始从Kafka主题中读取记录？

[英]How to read records from Kafka topic from beginning in Spark Streaming?

Spark连续处理模式不会读取所有kafka主题分区

[英]Spark continuous processing mode does not read all kafka topic partition

使用Spark StreamingContext从Kafka主题中消费

[英]Using Spark StreamingContext to Consume from Kafka topic

使用scala从kafka主题流式传输Spark

[英]Spark streaming from kafka topic using scala

Spark批处理从多列DataFrame写入Kafka主题

[英]Spark batch write to Kafka topic from multi-column DataFrame

如何在Spark Streaming作业的每批中使用不同的Kafka主题？

[英]How to consume from a different Kafka topic in each batch of a Spark Streaming job?

如何在火花流中映射kafka主题名称和相应记录

[英]How to map kafka topic names and respective records in spark streaming

如何使用Core spark从Kafka读取消息进行批处理

[英]How to read messages from Kafka using Core spark for batch processing

如何将 Kafka 主题数据加载到 Python 中的 Spark Dstream 中

[英]How to load Kafka topic data into a Spark Dstream in Python

阅读Spark批处理作业中的Kafka主题

[英]Read Kafka topic in a Spark batch job

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何从Spark Streaming开始从Kafka主题中读取记录？ Spark连续处理模式不会读取所有kafka主题分区使用Spark StreamingContext从Kafka主题中消费使用scala从kafka主题流式传输Spark Spark批处理从多列DataFrame写入Kafka主题如何在Spark Streaming作业的每批中使用不同的Kafka主题？如何在火花流中映射kafka主题名称和相应记录如何使用Core spark从Kafka读取消息进行批处理如何将 Kafka 主题数据加载到 Python 中的 Spark Dstream 中阅读Spark批处理作业中的Kafka主题

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM