![](/img/trans.png)
[英]How to add new column in existing table uaing jdbc pyspark python?
[英]Pyspark, How to add a new existing column
所以說我有一個像這樣的數據集:
Y M D
2017 3 4
2017 2 5
當我像這樣融合第一個數據集時創建了一個單列數據集:
Y:M:D
2017:3:4
2017:2:5
我現在將如何將它們結合在一起,並使用新的列名稱:
Y M D Date
2017 3 4 2017:3:4
2017 2 5 2017:2:5
沒關系,我錯誤地使用了函數,這就是為什么它不起作用的原因。 解決方法如下:將D1作為第一個數據集:
from pyspark.sql.functions import concat,lit
D1 = flights_df.withColumn('Date',
concat(col("Y"), lit(":"), col("M"),lit(":"),col("D")))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.