简体   繁体   English

加快日期列从字符串到日期时间的转换(熊猫)

[英]Speed up date columns conversion (pandas) from string to datetime

I am working with a large .csv file in python and its date column is 'str'. 我正在使用python中的大型.csv文件,其日期列为'str'。 I am using the following code to convert the records in this column to datetime. 我正在使用以下代码将此列中的记录转换为datetime。

df[date_column].fillna('1900-01-01',inplace=True)
df[date_column] = df[date_column].apply(lambda x : pd.to_datetime(x, format = datetime_format))

But this seems to be taking quite a long time to execute. 但这似乎要花很长时间才能执行。 Any suggestions on how to handle this is welcomed. 欢迎提出任何有关如何处理此问题的建议。 Thanks. 谢谢。

When you read your csv , you can using parse_dates 读取csv时,可以使用parse_dates

df = pd.read_csv('yourcsv.csv',parse_dates = date_column)

Then let us using converters 然后让我们使用converters

pd.read_csv('yourcsv.csv', converters={'date_column':lambda x : pd.to_datetime(x,errors = 'coerce')})

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM