簡體 English 中英

Apache Spark：什么時候不使用mapPartition和foreachPartition？

[英]Apache Spark : When not to use mapPartition and foreachPartition?

原文 2018-03-28 05:52:23 0 1 scala/ apache-spark/ apache-spark-sql/ spark-dataframe

我知道，當我們要為一組RDD而不是單個RDD元素初始化一些資源時，理想情況下，我們應該使用mapPartition和foreachPartition。 例如，在為每個數據分區初始化JDBC連接的情況下。 但是在某些情況下，我們不應該使用它們中的任何一個，而應該使用普通香草map（）和foreach（）轉換和操作。

1 個解決方案

當編寫使用mapPartition或foreachPartition的Spark作業時，您可以只修改分區數據本身，也可以分別遍歷分區數據。 作為參數傳遞的匿名函數將在執行程序上執行，因此沒有可行的方法來執行從所有特定執行程序調用所有節點的代碼，例如：df.reduceByKey。 只能從驅動程序節點執行此代碼。 因此，只有從驅動程序代碼中，您才能訪問數據框，數據集和Spark會話。

請在這里找到有關此問題的詳細討論以及可能的解決方案

Apache Spark - foreach 與 foreachPartition 何時使用什么？

[英]Apache Spark - foreach Vs foreachPartition When to use What?

Apache Spark mapPartition奇怪的行為（懶惰的評估？）

[英]Apache Spark mapPartition strange behavior (lazy evaluation?)

Spark：如何使用mapPartition並為每個分區創建/關閉連接

[英]Spark : How to use mapPartition and create/close connection per partition

Spark：將mapPartition與Scala一起使用

[英]Spark: Using mapPartition with Scala

mapPartition Spark中的調用函數

[英]Calling function in mapPartition Spark

如何在Spark 2.2中使用foreachPartition以避免任務序列化錯誤

[英]How to use foreachPartition in Spark 2.2 to avoid Task Serialization error

Spark流：foreachPartition中的NullPointerException

[英]Spark Streaming: NullPointerException inside foreachPartition

使用mapPartition和迭代器保存spark RDD

[英]Save a spark RDD using mapPartition with iterator

Spark：mapPartition中的選項拋出Task不可序列化

[英]Spark: Option in mapPartition throwing Task not serializable

spark foreachPartition，如何獲取每個分區的索引？

[英]spark foreachPartition, how to get an index of each partition?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Apache Spark - foreach 與 foreachPartition 何時使用什么？ Apache Spark mapPartition奇怪的行為（懶惰的評估？） Spark：如何使用mapPartition並為每個分區創建/關閉連接 Spark：將mapPartition與Scala一起使用 mapPartition Spark中的調用函數如何在Spark 2.2中使用foreachPartition以避免任務序列化錯誤 Spark流：foreachPartition中的NullPointerException 使用mapPartition和迭代器保存spark RDD Spark：mapPartition中的選項拋出Task不可序列化 spark foreachPartition，如何獲取每個分區的索引？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM