[英]Speed up date columns conversion (pandas) from string to datetime
I am working with a large .csv file in python and its date column is 'str'. 我正在使用python中的大型.csv文件,其日期列为'str'。 I am using the following code to convert the records in this column to datetime. 我正在使用以下代码将此列中的记录转换为datetime。
df[date_column].fillna('1900-01-01',inplace=True)
df[date_column] = df[date_column].apply(lambda x : pd.to_datetime(x, format = datetime_format))
But this seems to be taking quite a long time to execute. 但这似乎要花很长时间才能执行。 Any suggestions on how to handle this is welcomed. 欢迎提出任何有关如何处理此问题的建议。 Thanks. 谢谢。
When you read your csv , you can using parse_dates
读取csv时,可以使用parse_dates
df = pd.read_csv('yourcsv.csv',parse_dates = date_column)
Then let us using converters
然后让我们使用converters
pd.read_csv('yourcsv.csv', converters={'date_column':lambda x : pd.to_datetime(x,errors = 'coerce')})
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.