[英]Calculate percentage of specific grouped values
我有一个数据框:
id is_good
a1 1
a1 1
a1 0
bb 1
bb 0
bb 0
bb 0
с1 0
с1 0
d2 1
d2 1
如您所见,有些情况下 id 值只有 is_good 类型。 我想为每个 id 计算 0 和 1 的百分比。 如果 id 值只有 is_good 类型,那么他没有的类型必须是 0%。 与 d2 相同。 所以想要的结果是:
id is_good_perc
a1 0.67
bb 0.25
с1 0
d2 1
怎么做? 对我来说棘手的部分是 id c1 和 d2 的情况。
我试过这个:
.groupby("id").is_good.value_count(normalize=True)
但它不会为 c1 和 d2 创建 0
您将df.is_good
按df.id
然后将总和除以计数:
>>> grouped = df['is_good'].groupby(df.id)
>>> df1 = pd.DataFrame(grouped.sum() / grouped.count()).round(2).rename(columns={'is_good': 'is_good_perc'})
>>> df1
is_good_perc
id
a1 0.67
bb 0.25
d2 1.00
с1 0.00
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.