如何使用groupby在pandas中以相反的順序對列求和

Question

我目前需要復制這個數據集，我必須在其中按主題 ID 副本分組，並計算將來有多少得分為 1。 我基本上必須反向計算它們，但是我不確定如何同時執行此操作和 groupby 主題 ID。

   SubjectID copy  Score  Number of All Future Hosp for O column
0        phchp003      1                                       4
1        phchp003      1                                       3
2        phchp003      1                                       2
3        phchp003      1                                       1
4        phchp003      1                                       0
5        phchp004      1                                       4
6        phchp004      1                                       3
7        phchp004      1                                       2
8        phchp004      1                                       1
9        phchp004      1                                       0
10       phchp006      0                                       3
11       phchp006      0                                       3
12       phchp006      0                                       3
13       phchp006      0                                       3
14       phchp006      1                                       2
15       phchp006      1                                       1
16       phchp006      1                                       0

我目前有

data['Sum']= data.groupby(['SubjectID copy'])['Score'].cumsum()

這給了我值，但按降序求和，我需要我的從下到上。

Answer 1

在使用groupby transform之前，我們可以使用loc進行反轉。 然后我們可以使用shift和cumsum只考慮“未來”值：

data['Sum'] = (
    data.loc[::-1]  # Reverse DataFrame
        .groupby(['SubjectID copy'])['Score']  # Groups
        .transform(lambda s: s.shift(fill_value=0).cumsum())  # handle transformation
)

data ：

   SubjectID copy  Score  Sum
0        phchp003      1    4
1        phchp003      1    3
2        phchp003      1    2
3        phchp003      1    1
4        phchp003      1    0
5        phchp004      1    4
6        phchp004      1    3
7        phchp004      1    2
8        phchp004      1    1
9        phchp004      1    0
10       phchp006      0    3
11       phchp006      0    3
12       phchp006      0    3
13       phchp006      0    3
14       phchp006      1    2
15       phchp006      1    1
16       phchp006      1    0

Answer 2

要找出未來有多少個1 ，請transform組sum並減去cumsum 。

df['Sum'] = (df.groupby('SubjectID copy')['Score'].transform('sum')
             - df.groupby('SubjectID copy')['Score'].cumsum())

   SubjectID copy  Score  Sum
0        phchp003      1    4
1        phchp003      1    3
2        phchp003      1    2
3        phchp003      1    1
4        phchp003      1    0
5        phchp004      1    4
6        phchp004      1    3
7        phchp004      1    2
8        phchp004      1    1
9        phchp004      1    0
10       phchp006      0    3
11       phchp006      0    3
12       phchp006      0    3
13       phchp006      0    3
14       phchp006      1    2
15       phchp006      1    1
16       phchp006      1    0

如何使用groupby在pandas中以相反的順序對列求和

問題描述

2 個解決方案

解決方案1
1 已采納 2021-07-27 14:47:51

解決方案2
1 2021-07-27 14:47:59

如何使用groupby在pandas中以相反的順序對列求和

問題描述

2 個解決方案

解決方案1 1 已采納 2021-07-27 14:47:51

解決方案2 1 2021-07-27 14:47:59

解決方案1
1 已采納 2021-07-27 14:47:51

解決方案2
1 2021-07-27 14:47:59