[英]How to add an array of list as a new column to a spark dataframe using pyspark
[英]pyspark- how to add a column to spark dataframe from a list
我正在寻找一种从列表中在 Spark DF 中添加新列的方法。 在 pandas 方法中,处理它很容易,但在 spark 中似乎相对困难。 请找一个例子
#pandas approach
list_example = [1,3,5,7,8]
df.new_column = list_example
#spark ?
你能帮忙解决这个问题吗(最简单的解决方案)?
您可以尝试以下方法:
import pyspark.sql.functions as F
list_example = [1,3,5,7,8]
new_df = df.withColumn("new_column", F.array( [F.lit(x) for x in list_example] ))
new_df.show()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.