[英]Cannot filter dates at pandas dataframe
我有一个 .csv 文件,其中包含多个列,其中一个称为Date
并且具有 2018 的日期值,如下所示:
此列的 .csv 格式为Date
。
我将在我的源代码中执行以下操作:
import pandas as pd
# Load data
data_daily = pd.read_csv('Desktop/data_daily.csv', keep_default_na=True)
# Filter data_daily down to only October
data_daily = data_daily[(data_daily['Date'] > '01/10/2018') & (data_daily['Date'] < '31/10/2018')]
# Save as a new .csv file
data_daily.to_csv('Desktop/final.csv', index=False)
但是,最终的 .csv 文件包含所有日期,而不仅仅是我想要的日期。
我不知道这是否有区别,但请记住,有多条线路具有相同的日期。
我怎样才能解决这个问题?
首先在read_csv
添加参数parse_dates
来解析列到日期时间:
data_daily = pd.read_csv('Desktop/data_daily.csv',
keep_default_na=True,
parse_dates=['Date'],
dayfirst=True)
然后使用您的解决方案或替代用between
用字符串转换为Timestamp
:
s = pd.Timestamp('2018-10-01')
e = pd.Timestamp('2018-10-31')
data_daily = data_daily[data_daily['Date'].between(s, e, inclusive=False)]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.