Python pandas groupby 按類別占總數的百分比

Question

我有下表：

+-----+----------+---+
| Grp | Category | X |
+-----+----------+---+
|   1 | A        | 1 |
|   1 | B        | 3 |
|   1 | B        | 2 |
|   1 | C        | 2 |
|   2 | A        | 2 |
|   2 | A        | 4 |
|   2 | B        | 4 |
|   3 | A        | 3 |
|   3 | C        | 7 |
+-----+----------+---+

並試圖獲得關注：

+-----+----------+---------+
| Grp | Category | X_ratio |
+-----+----------+---------+
|   1 | A        | 1/8     |
|   1 | B        | 5/8     |
|   1 | C        | 2/8     |
|   2 | A        | 6/10    |
|   2 | B        | 4/10    |
|   3 | A        | 3/10    |
|   3 | C        | 7/10    |
+-----+----------+---------+

有點卡住了。 有人可以建議有效的解決方案嗎？

我當前的代碼 - 它可以工作，但似乎效率不高：

grp_Cat = df.groupby(['Grp', 'Category ']).agg({'X': 'sum'})
grp_total = df.groupby(['Grp']).agg({'X': 'sum'})
grp_Cat.div(grp_total, level='Grp') * 100

Answer 1

因為性能很重要，所以首先將sum匯總到MultiIndex Series ，然后除以每個第一個Grp級別的Series.div總和值：

s = df.groupby(['Grp','Category'])['X'].sum()
df = s.div(s.sum(level=0), level=0).reset_index(name='X_ratio')
print (df)
   Grp Category  X_ratio
0    1        A    0.125
1    1        B    0.625
2    1        C    0.250
3    2        A    0.600
4    2        B    0.400
5    3        A    0.300
6    3        C    0.700

較慢的替代方案：

df = (df.groupby(['Grp','Category'])['X'].sum()
        .groupby(level=0)
        .apply(lambda x: x / x.sum())
        .reset_index(name='X_ratio'))
print (df)
   Grp Category  X_ratio
0    1        A    0.125
1    1        B    0.625
2    1        C    0.250
3    2        A    0.600
4    2        B    0.400
5    3        A    0.300
6    3        C    0.700

Python pandas groupby 按類別占總數的百分比

問題描述

1 個解決方案

解決方案1
2 已采納 2020-05-18 07:38:54

Python pandas groupby 按類別占總數的百分比

問題描述

1 個解決方案

解決方案1 2 已采納 2020-05-18 07:38:54

解決方案1
2 已采納 2020-05-18 07:38:54