[英]Extracting a date at the end of a pandas dataframe
我有一列具有以下格式的数据:
bla bla bla, bla bla bla, bla bla bla, bla bla bla bla bla bla, 23/09/2012
有没有一种简单的方法可以从所有行中提取字符串末尾的日期? 每次都采用相同的DD / MM / YYYY格式。
我可以拆分最后一个,但是如果可以指定我想要日期,以防数据出错,那将是很好的。
row.split(", ")[-1]
是字符串23/09/2012
,现在您可以使用date
模块将其提取到Date
对象中。 并使用try
/ except
用于错误处理。
您可以使用字符串切片,后跟pd.to_datetime
。 例如:
df['col'] = pd.to_datetime(df['col'].str[-10:], dayfirst=True)
如果不确定日期是否在字符串末尾,请使用str.extract
df['date'] = df['col'].str.extract('(\d{2}/\d{2}/\d{4})', expand = False)
0 23/09/2012
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.