簡體   English   中英

Pyspark,如何添加新的現有列

[英]Pyspark, How to add a new existing column

所以說我有一個像這樣的數據集:

Y     M     D
2017  3     4
2017  2     5

當我像這樣融合第一個數據集時創建了一個單列數據集:

Y:M:D
2017:3:4
2017:2:5

我現在將如何將它們結合在一起,並使用新的列名稱:

Y     M     D   Date
2017  3     4   2017:3:4
2017  2     5   2017:2:5

沒關系,我錯誤地使用了函數,這就是為什么它不起作用的原因。 解決方法如下:將D1作為第一個數據集:

from pyspark.sql.functions import concat,lit
D1 = flights_df.withColumn('Date', 
                concat(col("Y"), lit(":"), col("M"),lit(":"),col("D")))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM