[英]How to convert multiple columns i.e time ,year,month and date into datetime format in pyspark dataframe
[英]datetime format but i only want the month / year in the columns
我正在對我的 dataframe 執行一些數據清理,並且有兩列標記為 Tranc_Year 和 Tranc_Month。
這兩列最初是 int64 數據類型,我想將它們轉換為 datetime。
但是,使用以下代碼將其轉換為日期時間后:
df_train.loc[:,'Tranc_Year'] = pd.to_datetime(df_train['Tranc_Year'], format='%Y') df_train.loc[:,'Tranc_Month'] = pd.to_datetime(df_train['Tranc_Month'] , 格式='%m')
如何在保持原始顯示的同時轉換為日期時間?
通過按字典rename
,將to_datetime
與year, month, day
列一起使用:
d = {'Tranc_Year':'year','Tranc_Month':'month'}
df1 = df_train[['Tranc_Year', 'Tranc_Month']].rename(columns=f).assign(day=1)
df_train['date'] = pd.to_datetime(df1)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.