如何聚合数据框并按布尔列求和？

Question

我有这个 df 并想聚合它，以便最后 2 列总结并减少每个用户 ID 的重复项。

当前的

user_id | name | product | ...| purchase_flag | retention_flag
123     | John | book    | ...| 0             | 1
123     | John | book    | ...| 1             | 0
....

理想状态

user_id | name | product | ...| purchase_flag | retention_flag
123     | John | book    | ...| 1             | 1
....

我总共有 100 列，所以在 pandas 中手动进行 groupby 是不可行的。 如何按 df 中的所有列分组，然后按 purchase_flag 和 retention_flag 求和？

我尝试：

df.groupby([how to put all cols here expect the flag columns?]).agg({'purchase_flag':'sum','retention_flag':'sum',})

我该如何完成这个？

Answer 1

如果列表理解中的dict中不存在，则可以过滤所有列名：

d = {'purchase_flag':'sum','retention_flag':'sum'}
df = df.groupby([c for c in df.columns if c not in d], as_index=False).agg(d)
print (df)
   user_id  name product  purchase_flag  retention_flag
0      123  John    book              1               1

如何聚合数据框并按布尔列求和？

问题描述

1 个解决方案

解决方案1
0 2022-12-22 06:07:45

如何聚合数据框并按布尔列求和？

问题描述

1 个解决方案

解决方案1 0 2022-12-22 06:07:45

解决方案1
0 2022-12-22 06:07:45