如何在保持原始數據格式的同時計算 pandas dataframe 中一組列的百分比

Question

我有一個數據集如下：

   date        product_category   product_type   amount 
2020-01-01             A               1           15
2020-01-01             A               2           25
2020-01-01             A               3           10
2020-01-02             B               1           15
2020-01-02             B               2           10
2020-01-03             C               2           100
2020-01-03             C               1           250
2020-01-03             C               3           150

我正在嘗試根據下面給出的product_category and date將這些數據轉換為標准化數量：

   date        product_category   product_type   amount 
2020-01-01             A               1           0.30
2020-01-01             A               2           0.50
2020-01-01             A               3           0.20
2020-01-02             B               1           0.60
2020-01-02             B               2           0.40
2020-01-03             C               2           0.20
2020-01-03             C               1           0.50
2020-01-03             C               3           0.30

有什么辦法可以處理 python 數據幀並更新原始熊貓 dataframe？

Answer 1

使用帶有 sum 的GroupBy.transform重復聚合sum ，因此可能除以原始列amount ：

#to new column
df['norm'] = df['amount'].div(df.groupby(['date','product_category'])['amount'].transform('sum'))

#rewrite original column
#df['amount'] = df['amount'].div(df.groupby(['date','product_category'])['amount'].transform('sum'))

print (df)
         date product_category  product_type  amount  norm
0  2020-01-01                A             1      15   0.3
1  2020-01-01                A             2      25   0.5
2  2020-01-01                A             3      10   0.2
3  2020-01-02                B             1      15   0.6
4  2020-01-02                B             2      10   0.4
5  2020-01-03                C             2     100   0.2
6  2020-01-03                C             1     250   0.5
7  2020-01-03                C             3     150   0.3

如何在保持原始數據格式的同時計算 pandas dataframe 中一組列的百分比

問題描述

1 個解決方案

解決方案1
1 已采納 2021-01-14 07:49:21

如何在保持原始數據格式的同時計算 pandas dataframe 中一組列的百分比

問題描述

1 個解決方案

解決方案1 1 已采納 2021-01-14 07:49:21

解決方案1
1 已采納 2021-01-14 07:49:21