[英]Pandas - converting dates to datetime, day-month-year to year month day fails with parse dates
我有一个包含 6 个日期列的患者和手术数据框。 日期采用日-月-年的格式。 要获得住院时间,我需要从出院日期 (DISDATE) 中减去入院日期 [ADMIDATE]。 我想将日期列更改为日期时间列。
举个例子
ADMIDATE DISDATE
0 06/06/2014 07/06/2014
1 23/06/2014 23/06/2014
如果使用
pd.read_csv('/Users/.......csv', parse_dates=['ADMIDATE', 'DISDATE'])
我得到
ADMIDATE DISDATE
0 2014-06-06 2014-07-06
1 2014-06-23 2014-06-23
6 月 7 日变成了 7 月 6 日。(DISDATE , row[0] ) 如果我使用更严格的
for col in ['ADMIDATE', 'DISDATE']:
df[col] = pd.to_datetime(df[col], format='%d/%m/%Y')
有用
ADMIDATE DISDATE
0 2014-06-06 2014-06-07
1 2014-06-23 2014-06-23
但它不会接受许多空行,例如在数据收集时患者尚未出院。 我可以在 excel 中格式化日期列以将 csv 转换为年-月-日格式,然后使用解析日期并且它可以正常工作,但我想知道我可以用to_datetime
做什么。
dayfirst
此参数强制解析器首先解释这一天
df.apply(pd.to_datetime, dayfirst=True)
ADMIDATE DISDATE
0 2014-06-06 2014-06-07
1 2014-06-23 2014-06-23
要指定列:
df[['ADMIDATE', 'DISDATE']].apply(pd.to_datetime, dayfirst=True)
ADMIDATE DISDATE
0 2014-06-06 2014-06-07
1 2014-06-23 2014-06-23
error='coerce'
为了适应缺失的数据:
df[['ADMIDATE', 'DISDATE']].apply(
pd.to_datetime, dayfirst=True, errors='coerce'
)
ADMIDATE DISDATE
0 2014-06-06 2014-06-07
1 2014-06-23 2014-06-23
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.