[英]How to change an incorrect datetime format from a raw csv file to a proper datetime format in Python
我有一个像这样的 Python 数据框
Index Name Dateofbirth
0 A. 12JAN1980:00:00:00.000000
1 B. 17JUN1954:00:00:00.000000
...
1250000 X. 09DEC1957:00:00:00.0000
问题是在原始数据 csv 文件中,我的日期以这种格式存储%d%m%Y:00:00:00.000000
因此,当我将这个 csv 文件读入 Python 并使用以下代码将出生日期列转换为日期时间时,问题就出现了
df['Dateofbirth'] =pd.to_datetime(df['Dateofbirth'])
我收到以下错误:
raise ValueError("Unknown string format:", timestr) ValueError: ('Unknown string format:', '12JAN1980:00:00:00.000000
如何将此格式更改为可接受的日期时间格式 %Y%m%d %H%M%S ? 更改原始 csv 文件是不可能的,因为有超过 1000000 行。
请帮忙! 对于缺少文本格式,我深表歉意。
你可以试试这个,它会返回Dateofbirth
类型为 object:
df['Dateofbirth'] = pd.to_datetime(df.Dateofbirth)
df['Dateofbirth'] = df['Dateofbirth'].dt.strftime('%Y%m%d %H%M%S')
或者如果您希望Dateofbirth
作为日期时间类型,则使用它:
df['Dateofbirth'] = pd.to_datetime(df['Dateofbirth'])
df['Dateofbirth'] = pd.to_datetime(df['Dateofbirth'].dt.strftime('%Y%m%d %H%M%S'))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.