Pandas：执行多个复杂聚合的惯用方式？

Question

我有一张如下表：

ID   SCORE
A    NaN
A    NaN
B    1
B    2
C    5

我想要以下 output：

ID    SUM_SCORE   SIZE_SCORE
A     NaN         2
B     3           2
C     5           1

由于我想保留 NaN，我需要使用sum(min_count=1) 。 所以到目前为止我有以下内容：

grp = df.groupby('ID')
sum_score = grp['SCORE'].sum(min_count=1).reset_index()
size_score = grp['SCORE'].size().reset_index()
result = pd.merge(sum_score, size_score, on=['ID'])

这感觉真的很不雅。 有没有更好的方法来获得我正在寻找的结果？

Answer 1

s=df.groupby('ID').SCORE.agg([('sum_score',lambda x : x.sum(min_count=1)),
                             ('size_score','size')] ).reset_index()
  ID  sum_score  size_score
0  A        NaN           2
1  B        3.0           2
2  C        5.0           1

Answer 2

您可以使用以下方法进行聚合：

df_agg = df.groupby("ID", as_index=False).agg(["sum","count"])

# rename your columns
df_agg.columns = ["ID","SUM_SCORE", "SIZE_SCORE"]

Pandas：执行多个复杂聚合的惯用方式？

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-04-26 19:13:45

解决方案2
0 2020-04-26 19:18:50

Pandas：执行多个复杂聚合的惯用方式？

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-04-26 19:13:45

解决方案2 0 2020-04-26 19:18:50

解决方案1
1 已采纳 2020-04-26 19:13:45

解决方案2
0 2020-04-26 19:18:50