繁体 English 中英

Spark批处理从多列DataFrame写入Kafka主题

[英]Spark batch write to Kafka topic from multi-column DataFrame

原文 2018-11-23 14:36:54 1 1 apache-spark/ apache-kafka/ apache-spark-sql

批处理之后，Spark ETL我需要向Kafka主题写入包含多个不同列的结果DataFrame。

根据以下Spark文档https://spark.apache.org/docs/2.2.0/structured-streaming-kafka-integration.html ，要写入Kafka的数据框在架构中应具有以下必填列：

值（必需）字符串或二进制

正如我之前提到的，我有更多带有值的列，所以我有一个问题-如何将整个DataFrame行作为一条消息从我的Spark应用程序正确发送给Kafka主题？ 我是否需要将所有列中的所有值都用一个值列（将包含所连接的值）连接到新的DataFrame中，还是有更合适的方法来实现呢？

1 个解决方案

文档已经暗示了执行此操作的正确方法，并且与您对任何Kafka客户端所做的操作并没有真正的不同-您必须先对有效负载进行序列化，然后再发送给Kafka。

如何做到这一点（ to_json ， to_csv ， Apache Avro ）取决于您的业务需求-除了您（或您的团队），没人能回答这个问题。

Spark Dataframe以avro格式写入kafka主题？

[英]Spark Dataframe write to kafka topic in avro format?

PySpark：将 Spark Dataframe 写入 Kafka 主题

[英]PySpark : Write Spark Dataframe to Kafka Topic

从 kafka 主题读取数据到 spark dataframe

[英]Read Data from kafka topic into spark dataframe

Spark Streaming - 写入 Kafka 主题

[英]Spark Streaming - write to Kafka topic

无法使用 spark scala 读取和写入 kafka 主题

[英]Can't Read from and write to kafka topic using spark scala

从 Kafka 主题读取数据并使用 scala 和 spark 写回 Kafka 主题

[英]Read from Kafka topic process the data and write back to Kafka topic using scala and spark

[Py]Spark SQL：多列会话

[英][Py]Spark SQL: Multi-column sessionization

阅读Spark批处理作业中的Kafka主题

[英]Read Kafka topic in a Spark batch job

使用 Spark Structured Streaming 从 Kafka 主题读取：可以由 Spark 解析发布到 Kafka 主题的多行 JSON 吗？

[英]Reading from Kafka topic using Spark Structured Streaming: Can multi-line JSON published to Kafka topic be parsed by Spark?

使用 spark dataframe 阅读 kafka 主题

[英]Reading kafka topic using spark dataframe

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Spark Dataframe以avro格式写入kafka主题？ PySpark：将 Spark Dataframe 写入 Kafka 主题从 kafka 主题读取数据到 spark dataframe Spark Streaming - 写入 Kafka 主题无法使用 spark scala 读取和写入 kafka 主题从 Kafka 主题读取数据并使用 scala 和 spark 写回 Kafka 主题 [Py]Spark SQL：多列会话阅读Spark批处理作业中的Kafka主题使用 Spark Structured Streaming 从 Kafka 主题读取：可以由 Spark 解析发布到 Kafka 主题的多行 JSON 吗？使用 spark dataframe 阅读 kafka 主题

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM