子集行的熊貓總和並在DF中重新合並

Question

我有一個DF，根據以下內容：

      id_var1   id_var2  num_var1   num_var2
      1         1        1          1
      1         2        1          0
      1         3        2          0
      1         4        2          3
      1         5        3          3
      1         6        3          3
      1         7        3          0 
      1         8        4          0
      2         1        1          0
      2         2        2          1
      2         3        5          0
      2         4        2          0
      2         5        1          2  
      2         6        1          2
      2         7        2          0

我想要具有以下外觀的DF：

      id_var1   id_var2  num_var1   num_var2   row_sum
      1         1        1          1          2      
      1         2        1          0          NaN
      1         3        2          0          Nan
      1         4        2          3          11
      1         5        3          3          Nan
      1         6        3          3          Nan
      1         7        3          0          Nan
      1         8        4          0          Nan
      2         1        1          0          Nan
      2         2        2          1          7
      2         3        5          0          Nan
      2         4        2          0          Nan
      2         5        1          2          4
      2         6        1          2          Nan
      2         7        2          0          Nan

在每個不為0的第一個 num_var2處，我想求和（num_var1）相同的行+與num_var2狀態一樣多的行。

示例1 ：第4行的num_var2 = 3->第4行的sum（ num_var1 ）+ 3行向下= id_var1 = 1和id_var2 = 4的第11行

例2：第12行具有num_var2 = 2 - >總和（num_var1）用於行12個+ 2行向下= 4 id_var1 = 2和id_var2 = 5。

有人可以幫我這個嗎？ 可以在沒有慢行觸發的情況下完成嗎？

DF的代碼如下：

df = pd.DataFrame({ 'id_var1' : [1] * 8 + [2] * 7
                    ,'id_var2' : [i for i in range(1,9)] + [i for i in range(1,8)]
                   ,'num_var1' : [1,1,2,2,3,3,3,4] + [1,2,5,2,1,1,2]
               ,'num_var2' : [1, 0,0,3,3,3,0,0] + [0,1,0,0,2,2,0]
              })

Answer 1

讓我知道這是否適合您。

首先從num_var1列創建值列表。 然后獲得子列表的總和-從num_var1創建，從當前索引到所需的編號項（取自num_var2列）。

僅當前一條記錄的num_var2與當前記錄的num_var2不匹配時，才調用sublst（）函數。

import pandas as pd

df = pd.DataFrame({ 'id_var1' : [1] * 8 + [2] * 7
                    ,'id_var2' : [i for i in range(1,9)] + [i for i in range(1,8)]
                   ,'num_var1' : [1,1,2,2,3,3,3,4] + [1,2,5,2,1,1,2]
               ,'num_var2' : [1, 0,0,3,3,3,0,0] + [0,1,0,0,2,2,0]
              })

num_var1  =df['num_var1'].tolist() # values to be used for calcualtion
df['index1'] = df.index

def sublst(row):
    if row['num_var2']>0:
        x= num_var1[row['index1']:row['index1']+row['num_var2']+1]
        return sum(x)

df['sum'] = df[df.num_var2 != df.num_var2.shift()].apply(sublst,axis=1)

print df

產量

       id_var1  id_var2  num_var1  num_var2  index1   sum
0         1        1         1         1       0   2.0
1         1        2         1         0       1   NaN
2         1        3         2         0       2   NaN
3         1        4         2         3       3  11.0
4         1        5         3         3       4   NaN
5         1        6         3         3       5   NaN
6         1        7         3         0       6   NaN
7         1        8         4         0       7   NaN
8         2        1         1         0       8   NaN
9         2        2         2         1       9   7.0
10        2        3         5         0      10   NaN
11        2        4         2         0      11   NaN
12        2        5         1         2      12   4.0
13        2        6         1         2      13   NaN
14        2        7         2         0      14   NaN

子集行的熊貓總和並在DF中重新合並

問題描述

1 個解決方案

解決方案1
0 已采納 2017-02-14 18:25:06

子集行的熊貓總和並在DF中重新合並

問題描述

1 個解決方案

解決方案1 0 已采納 2017-02-14 18:25:06

解決方案1
0 已采納 2017-02-14 18:25:06