熊猫数据透视表有条件计数

Question

我有一个简单的数据帧：

df = pd.DataFrame({'id': ['a','a','a','b','b'],'value':[0,15,20,30,0]})
df
  id  value
0  a      0
1  a     15
2  a     20
3  b     30
4  b      0

我想要一个数值大于零的数据透视表。

我试过这个：

raw = pd.pivot_table(df, index='id',values='value',aggfunc=lambda x:len(x>0))

但是回复了这个：

    value
id
a       3
b       2

我需要的：

    value
id
a       2
b       1

我用groupby和filter阅读了很多解决方案。 是否可以使用pivot_table命令实现此目的？ 如果不是，哪种方法最好？

提前致谢

UPDATE

只是为了让我更清楚为什么我要避免使用过滤器解决方案。 在我的真实和复杂的df中，我有其他列，如下所示：

df = pd.DataFrame({'id': ['a','a','a','b','b'],'value':[0,15,20,30,0],'other':[2,3,4,5,6]})
df
  id  other  value
0  a      2      0
1  a      3     15
2  a      4     20
3  b      5     30
4  b      6      0

我需要将列“其他”加起来，但是当我过滤时我得到了这个：

df=df[df['value']>0]
raw = pd.pivot_table(df, index='id',values=['value','other'],aggfunc={'value':len,'other':sum})
    other  value
id
a       7      2
b       5      1

代替：

    other  value
id
a       9      2
b      11      1

Answer 1

需要sum为条件x>0创建的计数True s：

raw = pd.pivot_table(df, index='id',values='value',aggfunc=lambda x:(x>0).sum())
print (raw)
    value
id       
a       2
b       1

正如@Wen所说，另一个解决方案是：

df = df[df['value'] > 0]
raw = pd.pivot_table(df, index='id',values='value',aggfunc=len)

Answer 2

您可以在透视之前过滤数据帧：

pd.pivot_table(df.loc[df['value']>0], index='id',values='value',aggfunc='count')

熊猫数据透视表有条件计数

问题描述

2 个解决方案

解决方案1
5 已采纳 2018-03-16 14:37:30

解决方案2
1 2018-03-16 14:41:57

熊猫数据透视表有条件计数

问题描述

2 个解决方案

解决方案1 5 已采纳 2018-03-16 14:37:30

解决方案2 1 2018-03-16 14:41:57

解决方案1
5 已采纳 2018-03-16 14:37:30

解决方案2
1 2018-03-16 14:41:57