簡體   English   中英

pandas dataframe 中的列累計和

[英]Cumulative sum by column in pandas dataframe

我創建了以下 dataframe:

d = {'x': [0,0,1,1,1,1,1,2,2,2], 'y': [67,-5,78,47,88,12,-4,14,232,28]}
df = pd.DataFrame(data=d)
print(df)

看起來像這樣:

在此處輸入圖像描述

我想計算列“z”,它是列“y”與列“x”的累積。 因此,只要 x 具有相同的值,我就會計算累積分布。 生成的 dataframe 應如下所示:

在此處輸入圖像描述

因此,當 X 列更改值時,將計算新的累積分布。

我怎么能在 python 中做到這一點?

您可以使用groupby + cumsum cumsum

df['z'] = df.groupby('x')['y'].cumsum()

output:

   x    y    z
0  0   67   67
1  0   -5   62
2  1   78   78
3  1   47  125
4  1   88  213
5  1   12  225
6  1   -4  221
7  2   14   14
8  2  232  246
9  2   28  274

cumsum是您要搜索的內容:

df['z'] = df.groupby('x')['y'].cumsum()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM