Pandas groupby 累積總和忽略當前行

Question

我知道關於這個主題有一些問題（比如Pandas: Cumulative sum of one column based on value of another ）但是，它們都不能完全滿足我的要求。

假設我有一個像這樣的數據框

.

我想按月計算 Cost 分組的累積總和，避免考慮當前值，以獲得 Desired 列。通過使用groupby和cumsum我獲得 colum CumSum

.

生成數據幀的 DDL 是

df = pd.DataFrame({'Month': [1,1,1,2,2,1,3],
                   'Cost': [5,8,10,1,3,4,1]})

Answer 1

IIUC 你可以使用groupby.cumsum然后減去cost ；

df['cumsum_'] = df.groupby('Month').Cost.cumsum().sub(df.Cost)

print(df)

    Month  Cost  cumsum_
0      1     5        0
1      1     8        5
2      1    10       13
3      2     1        0
4      2     3        1
5      1     4       23
6      3     1        0

Answer 2

您可以執行以下操作：

df['agg']=df.groupby('Month')['Cost'].shift().fillna(0)
df['Cumsum']=df['Cost']+df['agg']

Pandas groupby 累積總和忽略當前行

問題描述

2 個解決方案

解決方案1
3 2020-03-16 15:51:18

解決方案2
1 已采納 2020-03-16 15:53:39

Pandas groupby 累積總和忽略當前行

問題描述

2 個解決方案

解決方案1 3 2020-03-16 15:51:18

解決方案2 1 已采納 2020-03-16 15:53:39

解決方案1
3 2020-03-16 15:51:18

解決方案2
1 已采納 2020-03-16 15:53:39