[英]pandas - combine time and date from two dataframe columns to a datetime column
这是此处接受的解决方案的后续问题。
我有一个 pandas dataframe:
在一列中,“时间”是以下列格式存储的时间:“ HHMMSS
”(例如 203412 表示 20:34:12)。
在另一列“日期”中,日期以以下格式存储:“ YYmmdd
”(例如 200712 表示 2020-07-12)。 YY
代表对 2000 年的附加。
例子:
import pandas as pd
data = {'time': ['123455', '000010', '100000'],
'date': ['200712', '210601', '190610']}
df = pd.DataFrame(data)
print(df)
# time date
#0 123455 200712
#1 000010 210601
#2 100000 190610
我需要第三列,其中包含其他两列的组合日期时间格式(例如2020-07-12 12:34:55
)。 到目前为止,我只能修改时间,但我不知道如何添加日期。
df['datetime'] = pd.to_datetime(df['time'], format='%H%M%S')
print(df)
# time date datetime
#0 123455 200712 1900-01-01 12:34:55
#1 000010 210601 1900-01-01 00:00:10
#2 100000 190610 1900-01-01 10:00:00
如何在df['datetime']
列中添加df['date']
列中的日期,以便 dataframe 为:
time date datetime
0 123455 200712 2020-07-12 12:34:55
1 000010 210601 2021-06-01 00:00:10
2 100000 190610 2019-06-10 10:00:00
我发现了这个问题,但我不确定如何将它用于我的目的。
您可以先连接列,然后指定格式:
df['datetime'] = pd.to_datetime(df['date'] + df['time'], format='%y%m%d%H%M%S')
print(df)
time date datetime
0 123455 200712 2020-07-12 12:34:55
1 000010 210601 2021-06-01 00:00:10
2 100000 190610 2019-06-10 10:00:00
如果可能 integer 列:
df['datetime'] = pd.to_datetime(df['date'].astype(str) + df['time'].astype(str), format='%y%m%d%H%M%S')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.