繁体 English 中英

Scala 与 Python 的 Spark 结构化流性能

[英]Spark Structured Streaming performance for Scala vs Python

原文 2020-06-09 09:30:52 2 1 scala/ apache-spark/ pyspark/ apache-kafka/ spark-structured-streaming

大家好~我打算用Kafka + Spark Structured Streaming开发一个小批量程序。 但是我很困惑，到底是用python还是scala，哪个更快。 如果在 Scala 和 Python 之间有任何关于 Spark Structured Streaming 的基准性能结果会更好。

1 个解决方案

不是真正的问题。

唯一的问题是 1) Scala 速度更快，但每个微批次的数据规模可能意味着影响更小，并且 2) Scala 具有类型的数据集支持，pyspark 没有。

大多数人将 Scala、pyspark 更多地用于数据科学。

也就是说，使用 pyspark 进行实时机器学习可能会更好。 参见例如： https://towardsdatascience.com/building-a-real-time-prediction-pipeline-using-spark-structured-streaming-and-microservices-626dc20899eb

Scala 与 Python 的 Spark 性能

[英]Spark performance for Scala vs Python

Spark 结构化流：Scala 中的模式推理

[英]Spark structured streaming: Schema Inference in Scala

Spark流（Spark 1.6）与结构化流（Spark 2.2）

[英]Spark Streaming (Spark 1.6) vs Structured Streaming (Spark 2.2)

Spark Structured Streaming ForeachWriter和数据库性能

[英]Spark Structured Streaming ForeachWriter and database performance

Spark Streaming Scala性能急剧降低

[英]Spark Streaming scala performance drastic slow

Scala Spark 结构化流过滤器按结构字段内的时间戳类型

[英]Scala Spark Structured Streaming Filter by TimestampType within Struct Field

Scala：从火花结构化流中读取 Kafka Avro 消息时出错

[英]Scala: Error reading Kafka Avro messages from spark structured streaming

窗口重载方法无法在 spark 结构化流 scala 中解析

[英]Window Overload method cannot resolve in spark structured streaming-scala

使用foreach进行Spark结构化流

[英]Spark Structured Streaming with foreach

Python vs Scala（适用于Spark作业）

[英]Python vs Scala (for Spark jobs)

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Scala 与 Python 的 Spark 性能 Spark 结构化流：Scala 中的模式推理 Spark流（Spark 1.6）与结构化流（Spark 2.2） Spark Structured Streaming ForeachWriter和数据库性能 Spark Streaming Scala性能急剧降低 Scala Spark 结构化流过滤器按结构字段内的时间戳类型 Scala：从火花结构化流中读取 Kafka Avro 消息时出错窗口重载方法无法在 spark 结构化流 scala 中解析使用foreach进行Spark结构化流 Python vs Scala（适用于Spark作业）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM