繁体   English   中英

pandas - 将时间和日期从两个 dataframe 列组合到一个日期时间列

[英]pandas - combine time and date from two dataframe columns to a datetime column

这是此处接受的解决方案的后续问题。

我有一个 pandas dataframe:

在一列中,“时间”是以下列格式存储的时间:“ HHMMSS ”(例如 203412 表示 20:34:12)。

在另一列“日期”中,日期以以下格式存储:“ YYmmdd ”(例如 200712 表示 2020-07-12)。 YY代表对 2000 年的附加。

例子:

import pandas as pd

data = {'time': ['123455', '000010', '100000'],
        'date': ['200712', '210601', '190610']}

df = pd.DataFrame(data)

print(df)

#     time    date
#0  123455  200712
#1  000010  210601
#2  100000  190610

我需要第三列,其中包含其他两列的组合日期时间格式(例如2020-07-12 12:34:55 )。 到目前为止,我只能修改时间,但我不知道如何添加日期。

df['datetime'] = pd.to_datetime(df['time'], format='%H%M%S')

print(df)

#     time    date            datetime
#0  123455  200712 1900-01-01 12:34:55
#1  000010  210601 1900-01-01 00:00:10
#2  100000  190610 1900-01-01 10:00:00

如何在df['datetime']列中添加df['date']列中的日期,以便 dataframe 为:

     time    date            datetime
0  123455  200712 2020-07-12 12:34:55
1  000010  210601 2021-06-01 00:00:10
2  100000  190610 2019-06-10 10:00:00

我发现了这个问题,但我不确定如何将它用于我的目的。

您可以先连接列,然后指定格式:

df['datetime'] = pd.to_datetime(df['date'] + df['time'], format='%y%m%d%H%M%S')
print(df)
     time    date            datetime
0  123455  200712 2020-07-12 12:34:55
1  000010  210601 2021-06-01 00:00:10
2  100000  190610 2019-06-10 10:00:00

如果可能 integer 列:

df['datetime'] = pd.to_datetime(df['date'].astype(str) + df['time'].astype(str), format='%y%m%d%H%M%S')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM