按 dataframe python 在一個組中的累積百分比計算

Question

分組數據集：

Col-a   col-b   
24567a   2
         3
         4
         6
56789c   1
         2
         3

是現有組-by dataframe。 誰能告訴我如何獲得以下格式的 output：

Col-a   col-b   Cum-Percentage
24567a   2       25%
         3       50%
         4       75%
         6       100%
56789b   1       33.33%
         2       66.66%
         3       100%

其中每個實例表示為一個組中發生的總實例的一小部分 - 按 dataframe（Pandas，python 3.8）。如果上面不清楚，請參見下圖中的表格。 任何幫助都會很棒，在此先感謝::)在此處輸入圖像描述

Answer 1

假設 Col-a 是索引：使用groupby cumcount + groupby transform然后map應用格式：

import pandas as pd

df = pd.DataFrame({
    'Col-a': ['24567a', '24567a', '24567a', '24567a', '56789c', '56789c',
              '56789c'],
    'col-b': [2, 3, 4, 6, 1, 2, 3]
}).set_index('Col-a')

g = df.groupby(level=0)
df['cum-percent'] = (
        (g.cumcount() + 1) / g['col-b'].transform('count') * 100
).map('{:.2f}%'.format)

        col-b cum-percent
Col-a                    
24567a      2      25.00%
24567a      3      50.00%
24567a      4      75.00%
24567a      6     100.00%
56789c      1      33.33%
56789c      2      66.67%
56789c      3     100.00%

如果 Col-a 是帶有空格而不是值的列，請使用replace + ffill然后使用上面的groupby函數：

import numpy as np
import pandas as pd

df = pd.DataFrame({
    'Col-a': ['24567a', '', '', '', '56789c', '', ''],
    'col-b': [2, 3, 4, 6, 1, 2, 3]
})

df['Col-a'] = df['Col-a'].replace({'': np.nan}).ffill()
g = df.groupby('Col-a')
df['cum-percent'] = (
        (g.cumcount() + 1) / g['col-b'].transform('count') * 100
).map('{:.2f}%'.format)

    Col-a  col-b cum-percent
0  24567a      2      25.00%
1  24567a      3      50.00%
2  24567a      4      75.00%
3  24567a      6     100.00%
4  56789c      1      33.33%
5  56789c      2      66.67%
6  56789c      3     100.00%

按 dataframe python 在一個組中的累積百分比計算

問題描述

1 個解決方案

解決方案1
0 2021-06-03 14:25:43

按 dataframe python 在一個組中的累積百分比計算

問題描述

1 個解決方案

解決方案1 0 2021-06-03 14:25:43

解決方案1
0 2021-06-03 14:25:43