熊貓df中的累積計數

Question

我正在嘗試基於pandas df兩列導出cumulative count 。

以下是df 。 我試圖導出count基於關Value和Count 。 因此，當count增加時，我希望將其歸因於相鄰value

import pandas as pd

d = ({
    'Value' : ['A','A','B','C','D','A','B','A'],
    'Count' : [0,1,1,2,3,3,4,5],
    }) 

df = pd.DataFrame(d)

我用了這個：

for val in ['A','B','C','D']:
    cond = df.Value.eq(val) & df.Count.eq(int)
    df.loc[cond, 'Count_' + val] = cond[cond].cumsum()

如果將int更改為特定數字，它將返回計數。 但是我需要它來讀取任何數字，因為Count列不斷增加。

我的預期輸出是：

  Value  Count  A_Count  B_Count  C_Count  D_Count
0     A      0        0        0        0        0
1     A      1        1        0        0        0
2     B      1        1        0        0        0
3     C      2        1        0        1        0
4     D      3        1        0        1        1
5     A      3        1        0        1        1
6     B      4        1        1        1        1
7     A      5        2        1        1        1

因此， second row的count增加，因此1變為Value A Count在row 4再次增加，這是Value C的首次出現，因此1 。 對第rows 5和第7 rows 5再次相同。 count在row 8增加，因此A變為2 。

Answer 1

您可以使用str.get_dummies以及diff和cumsum

In [262]: df['Value'].str.get_dummies().multiply(df['Count'].diff().gt(0), axis=0).cumsum()
Out[262]:
   A  B  C  D
0  0  0  0  0
1  1  0  0  0
2  1  0  0  0
3  1  0  1  0
4  1  0  1  1
5  1  0  1  1
6  1  1  1  1
7  2  1  1  1

哪一個

In [266]: df.join(df['Value'].str.get_dummies()
                  .multiply(df['Count'].diff().gt(0), axis=0)
                  .cumsum().add_suffix('_Count'))
Out[266]:
  Value  Count  A_Count  B_Count  C_Count  D_Count
0     A      0        0        0        0        0
1     A      1        1        0        0        0
2     B      1        1        0        0        0
3     C      2        1        0        1        0
4     D      3        1        0        1        1
5     A      3        1        0        1        1
6     B      4        1        1        1        1
7     A      5        2        1        1        1

熊貓df中的累積計數

問題描述

1 個解決方案

解決方案1
2 已采納 2018-07-19 03:37:21

熊貓df中的累積計數

問題描述

1 個解決方案

解決方案1 2 已采納 2018-07-19 03:37:21

解決方案1
2 已采納 2018-07-19 03:37:21