![](/img/trans.png)
[英]GRPC Error Docker Mac - Kafka Stream Processing with Python, Beam, and Flink
[英]Does Kafka python API support stream processing?
我在Java中使用过Kafka Streams,在python中找不到类似的API,请问Apache Kafka支持python中的stream处理吗?
Kafka Streams 仅作为 JVM 库提供,但至少有两个 Python 实现
从理论上讲,您可以尝试使用 Jython 或 Py4j 来支持它的 JVM 实现,但否则,如果您不想编写您的自己的 UDF(同样,仅限 Java,我上次检查过)。
除了这些选项之外,您还可以尝试 Apache Beam、Flink 或 Spark,但它们都需要一个外部集群调度程序来横向扩展。
如果您使用Apache Spark ,您可以将其用作生产者和消费者。 不需要像 Faust 那样依赖第三部分库,但你需要一个 Spark 集群管理器(独立、YARN 或 Kubernetes 来扩展它)
要在 Spark 中使用 Kafka 数据流,请使用Structured Streaming + Kafka 集成指南。
请记住,在使用spark-submit
时,您必须附加spark-sql-kafka
包:
spark-submit --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.1 StructuredStreaming.py
该解决方案已经在Spark 3.0.1和Kafka 2.7.0和PySpark上进行了测试。
此资源也很有用。
以前 KStrame python API 不可用,但现在可以使用新的 KStream python 库https://pypi.org/project/kstreams/
特征:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.