简体   繁体   English

如何在 Databricks 上将数据框导出为 excel

[英]How to export dataframe as excel on Databricks

I want to write multiple dataframes, either pandas, or koalas, or pyspark in one excel sheet and do something fancy like xlwx does(changing size or color of cells, etc), and save in an S3 bucket.我想在一张 Excel 表中编写多个数据帧,熊猫、考拉或 pyspark,并做一些像 xlwx 一样的奇特事情(更改单元格的大小或颜色等),然后保存在 S3 存储桶中。 I've tried pandas.to_csv(s3.....test.xlsx) but that is not what I want.我试过 pandas.to_csv(s3.....test.xlsx) 但这不是我想要的。

To merge dataframes, try something like this.要合并数据帧,请尝试这样的操作。

cond = [df.name == df2.name, df.age == df2.age]
df.join(df2, cond, 'inner')

Or, try converting the two objects to pandas dataframes and then do the merge.或者,尝试将两个对象转换为 Pandas 数据帧,然后进行合并。

Step #1:第1步:

df1= df1.select("*").toPandas()
df2= df2.select("*").toPandas()

Step #2:第2步:

result = pd.concat([df1, df2], axis=1)

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM