簡體   English   中英

在 PySpark DataFrame 中添加多個空列

[英]Adding Multiple Empty Columns in PySpark DataFrame

誰能建議我如何在 pyspark 數據框中添加多個空列。 目前我正在做這樣的事情,但它不起作用:

def add_columns(dataframe, column_list):
    for col in column_list:
        self = dataframe.withColumn(str(col), lit(None).cast(StringType())))
    return dataframe

在應用 add_columns 函數后的輸出模式中,我在 0x7f41189d7e10: string (nullable = true) 處獲得新列作為生成器對象geneexpr

你的代碼片段對我有用,只需在里面做這個小改動:

def add_columns(dataframe, column_list):
    self = dataframe.withColumn(str(column_list[0]), f.lit(None).cast(StringType()))
    for col in column_list[1:]:
        self = self.withColumn(str(col), f.lit(None).cast(StringType()))
    return self

我返回“self”而不是“dataframe”,以便在每次運行函數時不向數據幀添加多列。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM