繁体   English   中英

Pandas to_datetime 减慢脚本

[英]Pandas to_datetime Slowing Script

我有一个读取 CSV 文件的脚本,它最近似乎变慢了(我确信它曾经用这个代码运行得更快)。 我已将问题缩小到这一行代码:

data['datetime'] = pd.to_datetime(data['datetime'])

CSV 非常基础:

2021-11-03 09:30:00-04:00,150.39,150.8,150.3,150.47,9583

然而,仅运行 2000 行需要大约 0.2 秒,这似乎比我想象的要慢得多。

我曾尝试更新 python 和 pandas,以防万一,但问题仍然存在。

这段时间是否正常,还有什么我可以检查或做的事情来提高速度?

EDIT2 - 我重新创建了 CSV,我认为这已经治愈了它。 不幸的是它没有,我仍然在 ~0.2s 运行这行代码

尝试这个:

df = pd.read_csv(file, parse_dates=['datetime'])

编辑

如果它不适用于日期格式,请尝试以下操作:

dateparse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M:%S')

df = pd.read_csv(file, parse_dates=['datetime'], date_parser=dateparse)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM