簡體   English   中英

如何將數據框結果保存到數據塊中的表中?

[英]How to save a dataframe result into a table in databricks?

我試圖將已轉換為數據框的單詞列表保存到數據塊中的表中,以便稍后在群集重新啟動時可以查看或引用它。

我嘗試了下面的代碼,但是它一直給我一個錯誤或確實在運行,但是我看不到數據庫中的表

myWords_External=[['this', 'is', 'my', 'world'],['this', 'is', 'the', 'problem']]
df1 = pd.DataFrame(myWords_External)
df1.write.mode("overwrite").saveAsTable("temp.eehara_trial_table_9_5_19")

最后一行給我以下錯誤

AttributeError: 'DataFrame' object has no attribute 'write'

我認為您在代碼中混合了兩種不同的技術。 第一部分是熊貓:

myWords_External=[['this', 'is', 'my', 'world'],['this', 'is', 'the', 'problem']]
df1 = pd.DataFrame(myWords_External)

第二部分是pyspark:

df1.write.mode("overwrite").saveAsTable("temp.eehara_trial_table_9_5_19")

我不知道您的用例是什么,但是假設您要使用pandas並且不知道如何連接到基礎數據庫,這是將pandas數據幀轉換為pyspark數據幀並將其另存為的最簡單方法。一張桌子:

spark_df = spark.createDataFrame(df1)

spark_df.write.mode("overwrite").saveAsTable("temp.eehara_trial_table_9_5_19")

#you can create a new pandas dataframe witht the following command:
pd_df = spark.sql('select * from temp.eehara_trial_table_9_5_19').toPandas()

這樣效率低下,最好使用熊貓。 to_sql函數,但是您需要知道提供的數據庫和該數據庫的連接憑據。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM