繁体   English   中英

在熊猫数据框的末尾提取日期

[英]Extracting a date at the end of a pandas dataframe

我有一列具有以下格式的数据:

bla bla bla, bla bla bla, bla bla bla, bla bla bla bla bla bla, 23/09/2012

有没有一种简单的方法可以从所有行中提取字符串末尾的日期? 每次都采用相同的DD / MM / YYYY格式。

我可以拆分最后一个,但是如果可以指定我想要日期,以防数据出错,那将是很好的。

row.split(", ")[-1]是字符串23/09/2012 ,现在您可以使用date模块将其提取到Date对象中。 并使用try / except用于错误处理。

您可以使用字符串切片,后跟pd.to_datetime 例如:

df['col'] = pd.to_datetime(df['col'].str[-10:], dayfirst=True)

如果不确定日期是否在字符串末尾,请使用str.extract

df['date'] = df['col'].str.extract('(\d{2}/\d{2}/\d{4})', expand = False)

0    23/09/2012

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM