簡體 English 中英

如何決定spark中10億行的執行者數量

[英]how to decide number of executors for 1 billion rows in spark

原文 2022-07-26 04:10:59 6 1 apache-spark/ pyspark/ spark-shuffle

我們有一個包含 13.55 億行的表。 該表有 20 列。

我們想將此表與另一個具有更多或更少相同行數的表連接起來。

如何確定spark.conf.set("spark.sql.shuffle.partitions",?)的數量

如何確定執行者的數量及其資源分配細節？

如何找到這 13.55 億行將在 memory 中占用的存儲量？

1 個解決方案

就像@samkart 所說，您必須嘗試找出最佳參數，因為它取決於數據的大小和性質。 火花調整指南會很有幫助。

以下是您可能需要調整的一些內容：

spark.executor.cores默認為 1，但您應該增加它以提高並行性。 經驗法則是將其設置為 5。
spark.files.maxPartitionBytes確定讀取時每個分區的數據量，從而確定分區的初始數量。 您可以根據數據大小進行調整。 HDFS 中的默認值為 128 MB 塊。
spark.sql.shuffle.partitions默認為 200，但根據數據大小和內核數量進行調整。 這個博客會很有幫助。

如何確定火花工作中執行者的確切數量？他們的任何公式是什么？

[英]How to decide the exact number of executors in spark job?Is their any formula for that?

有人可以讓我知道如何確定Spark提交作業中的--executor內存和--num-of-executors嗎？ -core-of-cores的概念是什么

[英]can someone let me know how to decide --executor memory and --num-of-executors in spark submit job . What is the concept of -number-of-cores

如何確定Spark中的桶數

[英]How to decide number of buckets in Spark

當分區數與執行器數不匹配時，如何處理Spark執行器？

[英]How to handle Spark Executors when number of partitions do not match no of Executors?

Spark：如何指定持有RDD的執行者數量？

[英]Spark: How to specify the number of executors to hold an RDD?

Apache Spark執行者數量

[英]Apache Spark number of executors

如何在Java spark中獲取執行器數量和內核數量

[英]How to get number of executors and number of cores in Java spark

給定內核和執行器的數量，如何確定rdd中partd的數量？

[英]How to determine number of partitons of rdd in spark given the number of cores and executors ?

spark執行器是如何創建的？

[英]How are spark executors created?

Spark本地模式下的執行程序數

[英]Number of Executors in Spark Local Mode

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何確定火花工作中執行者的確切數量？他們的任何公式是什么？有人可以讓我知道如何確定Spark提交作業中的--executor內存和--num-of-executors嗎？ -core-of-cores的概念是什么如何確定Spark中的桶數當分區數與執行器數不匹配時，如何處理Spark執行器？ Spark：如何指定持有RDD的執行者數量？ Apache Spark執行者數量如何在Java spark中獲取執行器數量和內核數量給定內核和執行器的數量，如何確定rdd中partd的數量？ spark執行器是如何創建的？ Spark本地模式下的執行程序數

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM