使用日期比较条件计算非nan值的pandas数据帧中的值

Question

我有以下数据框：

Date_1                  Date_2                  Date_3
2019-12-18 13:43:47                             2019-12-18 13:43:47
2019-12-18 13:43:48     2019-12-18 13:43:47     
2020-12-18 17:51:17
2020-12-18 17:51:17     2020-12-18 17:51:17     2020-12-18 17:51:17

如果满足日期大于today的条件，我正在尝试计算每列中存在的值的数量。

我的代码：

today=pd.Timestamp.today() - pd.Timedelta(days=1)

total_date_1_events = len([df['Date_1']>today])+1
total_date_2_events = len([df['Date_2']>today])+1
total_date_3_events = len([df['Date_3']>today])+1

如果我打印 3 个变量中的每一个，它们都输出相同的结果，即 4，我理解这是因为空行也被计算在内。

我想得到以下结果：

total_date_1_events = 2 # because there are only 2 dates that are bigger than today
total_date_2_events = 1 # because there are only 1 date that is bigger than today
total_date_3_events = 1 # because there are only 1 date that is bigger than today

谢谢你的建议。

Answer 1

简单地做：

sum(df.Date_1>pd.Timestamp.today())
sum(df.Date_1>pd.Timestamp.today())
sum(df.Date_1>pd.Timestamp.today())

Answer 2

熊猫方式Series.sum和Series.gt ：

df['Date_1'].gt(today).sum()

如果您需要更多列，您可以这样做：

s = df[['Date_1','Date_2','Date_3']].gt(today).sum()

这创建了一个系列。 您可以使用以下方法访问值：

s['Date_1']
s['Date_2']

使用日期比较条件计算非nan值的pandas数据帧中的值

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-02-20 15:56:24

解决方案2
1 2020-02-20 15:59:18

使用日期比较条件计算非nan值的pandas数据帧中的值

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-02-20 15:56:24

解决方案2 1 2020-02-20 15:59:18

解决方案1
1 已采纳 2020-02-20 15:56:24

解决方案2
1 2020-02-20 15:59:18