簡體 English 中英

Pyspark數據框到Pandas數據框

[英]Pyspark dataframe to Pandas Dataframe

原文 2018-09-10 12:31:18 9 1 pandas/ dataframe/ pyspark

正在得到以下

將pyspark數據框轉換為Pandas數據框時出錯

碼：

some_df = sc.parallelize([
 ("A", "no"),
 ("B", "yes"),
 ("B", "yes"),
 ("B", "no")]
 ).toDF(["user_id", "phone_number"])

pandas_df = some_df.toPandas()

錯誤： Py4JJavaError：調用o104.collectToPython時發生錯誤。 在此處輸入圖片說明

1 個解決方案

它在我檢查的系統中運行良好，當Spark希望將所有數據加載到驅動程序內存中時，會出現此錯誤，因此可能您沒有足夠的內存來增加應該解決問題的驅動程序內存或使用gc.collect()清除垃圾gc.collect()讓我知道是否有幫助。

將pyspark數據框轉換為pandas數據框

[英]Convert pyspark dataframe to pandas dataframe

pyspark表轉pandas dataframe

[英]pyspark table to pandas dataframe

Pandas dataframe 在 pyspark 至 hive

[英]Pandas dataframe in pyspark to hive

TypeError在Pyspark中將Pandas數據框轉換為Spark數據框

[英]TypeError converting a Pandas Dataframe to Spark Dataframe in Pyspark

PySpark dataframe Pandas UDF 返回空 Z6A8064B5DF479455500553C47C5505

[英]PySpark dataframe Pandas UDF returns empty dataframe

將pyspark groupedData轉換為pandas DataFrame

[英]Convert pyspark groupedData to pandas DataFrame

Pyspark：將樣本轉換為 Pandas Dataframe

[英]Pyspark: Converting a sample to Pandas Dataframe

將 Pyspark RDD 轉換為 Pandas Dataframe

[英]Converting the Pyspark RDD into a Pandas Dataframe

pandas to pyspark dataframe vs jdbc connection to pyspark dataframe

[英]pandas to pyspark dataframe vs jdbc connection to pyspark dataframe

使用VectorUDT列將PySpark數據幀讀入Pandas的問題

[英]Issues reading PySpark dataframe into Pandas with VectorUDT columns

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 將pyspark數據框轉換為pandas數據框 pyspark表轉pandas dataframe Pandas dataframe 在 pyspark 至 hive TypeError在Pyspark中將Pandas數據框轉換為Spark數據框 PySpark dataframe Pandas UDF 返回空 Z6A8064B5DF479455500553C47C5505 將pyspark groupedData轉換為pandas DataFrame Pyspark：將樣本轉換為 Pandas Dataframe 將 Pyspark RDD 轉換為 Pandas Dataframe pandas to pyspark dataframe vs jdbc connection to pyspark dataframe 使用VectorUDT列將PySpark數據幀讀入Pandas的問題

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM