如何在 Python 中计算 groupby 中的百分比

Question

我有一个看起来像这样的数据框：

DATE                  SCHEDULED      ARTICLE_CODE      
2021-10-01            2              001
2021-10-01            2              002
2021-10-01            2              003
2021-11-01            2              001
2021-11-01            2              002
2021-11-01            2              003
2021-11-01            2              004
...

我想要的是获得每个日期的每篇文章代码的预定百分比

我想得到的是：

DATE                  SCHEDULED      ARTICLE_CODE  PERCENTAGE    
2021-10-01            2              001           33.3
2021-10-01            2              002           33.3
2021-10-01            2              003           33.3
2021-11-01            2              001           25
2021-11-01            2              002           25
2021-11-01            2              003           25
2021-11-01            2              004           25
...

我认为使用 groupby 是可行的，但我无法做到

Answer 1

使用Series.value_counts和Series.map作为计数列，从右侧除以100除以Series.rdiv ：

df['PERCENTAGE'] = df['DATE'].map(df['DATE'].value_counts()).rdiv(100).round(1)
print (df)
         DATE  SCHEDULED  ARTICLE_CODE  PERCENTAGE
0  2021-10-01          2             1        33.3
1  2021-10-01          2             2        33.3
2  2021-10-01          2             3        33.3
3  2021-11-01          2             1        25.0
4  2021-11-01          2             2        25.0
5  2021-11-01          2             3        25.0
6  2021-11-01          2             4        25.0

另一个想法：

df['PERCENTAGE'] = (100  / df.groupby('DATE')['ARTICLE_CODE'].transform('size')).round(1)

Answer 2

df['PERCENTAGE'] = df.groupby('DATE')['ARTICLE_CODE'].apply(lambda x: x*100/(x*len(x)))

Answer 3

这是pd.crosstab的一种方法-

df['PERCENTAGE'] = pd.crosstab(df['DATE'], df['ARTICLE_CODE'], normalize='index').stack().where(lambda x: x>0).dropna().round(2).reset_index()[0]

输出

         DATE  SCHEDULED  ARTICLE_CODE  PERCENTAGE
0  2021-10-01          2             1        0.33
1  2021-10-01          2             2        0.33
2  2021-10-01          2             3        0.33
3  2021-11-01          2             1        0.25
4  2021-11-01          2             2        0.25
5  2021-11-01          2             3        0.25
6  2021-11-01          2             4        0.25

如何在 Python 中计算 groupby 中的百分比

问题描述

3 个解决方案

解决方案1
3 2022-06-23 09:56:30

解决方案2
2 已采纳 2022-06-23 09:59:19

解决方案3
2 2022-06-23 10:19:13

如何在 Python 中计算 groupby 中的百分比

问题描述

3 个解决方案

解决方案1 3 2022-06-23 09:56:30

解决方案2 2 已采纳 2022-06-23 09:59:19

解决方案3 2 2022-06-23 10:19:13

解决方案1
3 2022-06-23 09:56:30

解决方案2
2 已采纳 2022-06-23 09:59:19

解决方案3
2 2022-06-23 10:19:13