简体繁体中英

Data Locality in Spark on Kubernetes

原文 2021-11-18 06:42:04 9 1 apache-spark/ hadoop/ kubernetes/ hdfs

Do we need HDFS or S3 when running Spark on Kubernetes? Will data locality be that efficient if we use just the nfs storage type?
Or maybe there is something fundamentally wrong in my understanding of Spark on Kubernetes.

1 answers

It depends. If you are working externally with data(HDFS/S3). Then you won't have data locality and performance won't be awesome.

You can run hdfs inside Kubernetes . To try and avoid this issue.

Data Locality in Spark on Kubernetes colocated with HDFS pods

Data locality in Spark Streaming

spark + hadoop data locality

spark data locality on large cluster

Does Spark use data locality?

Data locality with Spark standalone and HDFS

Apache spark data locality algorithm

Spark and HDFS on Kuberenetes data locality

Does spark on mesos support data locality?

Spark-Cassandra Connector -- Spark and Cassandra partitions -- data locality

暂无

The technical post webpages of this site follow the CC BY-SA 4.0 protocol. If you need to reprint, please indicate the site URL or the original address.Any question please contact:yoyou2525@163.com.

Related Question Data Locality in Spark on Kubernetes colocated with HDFS pods Data locality in Spark Streaming spark + hadoop data locality spark data locality on large cluster Does Spark use data locality? Data locality with Spark standalone and HDFS Apache spark data locality algorithm Spark and HDFS on Kuberenetes data locality Does spark on mesos support data locality? Spark-Cassandra Connector -- Spark and Cassandra partitions -- data locality

Related Tags

Data Locality in Spark on Kubernetes

Question

1 answers

solution1 0 2021-11-18 13:58:49

solution1
0 2021-11-18 13:58:49