[英]How do I handle different date format in a pandas column?
在某些数据集的日期列中,我以不同格式编写了日期列。 不是通常的数字格式样式,而是拼写出星期几和月份。 有些行的月份拼写很短,其他的则拼写完整。 很难做一个简单的pd.to_datetime(df,format)
。 我想过运行一个 for 循环。 我用'-'分割每一行:
for x in df['Date']:
if len(i.split('-')[1])<=6:
但后来我意识到这不是一个很好的条件。 我在想解决方案是正则表达式? 我该怎么办?
您不需要迭代,您可以将.loc
与.str
访问器拆分一起使用:
df.loc[df['Date'].str.split('-',expand=True)[6].str.len()<=6,'Date']
如果你愿意,你可以分配任何东西,或者只是得到它。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.