pandas-列中每個唯一字符串/組的新計算行

Question

我有一個數據幀df如：

GROUP  TYPE  COUNT
A       1     5
A       2     10
B       1     3
B       2     9
C       1     20
C       2     100

我想為每個組添加一行，以便新行計算COUNT的商，其中TYPE等於2， COUNT ，其中TYPE等於1，每個GROUP ala：

GROUP  TYPE  COUNT
A       1     5
A       2     10
A             .5
B       1     3
B       2     9
B             .33
C       1     20
C       2     100
C             .2

提前致謝。

Answer 1

df2 = df.pivot(index='GROUP', columns='TYPE', values='COUNT')
df2['div'] = df2[1]/df2[2]
df2.reset_index().melt('GROUP').sort_values('GROUP')

輸出：

  GROUP TYPE       value
0     A    1    5.000000
3     A    2   10.000000
6     A  div    0.500000
1     B    1    3.000000
4     B    2    9.000000
7     B  div    0.333333
2     C    1   20.000000
5     C    2  100.000000
8     C  div    0.200000

我的方法是通過旋轉重塑數據幀，因此每種類型都有自己的列。 然后划分很容易，然后通過熔化你重塑它原來的形狀。 在我看來，這也是一個非常易讀的解決方案。

當然，如果你喜歡將np.nan作為一個類型的div ，你可以很容易地替換它，但我不確定這是不是你想要的。

Answer 2

s=df[df.TYPE.isin([1,2])].sort_values(['GROUP','TYPE']).groupby('GROUP').COUNT.apply(lambda x : x.iloc[0]/x.iloc[1])
# I am sort and filter your original df ,to make they are ordered and only have type 1 and 2 
pd.concat([df,s.reset_index()]).sort_values('GROUP') 
# cancat your result back 

Out[77]: 
        COUNT GROUP  TYPE
0    5.000000     A   1.0
1   10.000000     A   2.0
0    0.500000     A   NaN
2    3.000000     B   1.0
3    9.000000     B   2.0
1    0.333333     B   NaN
4   20.000000     C   1.0
5  100.000000     C   2.0
2    0.200000     C   NaN

Answer 3

你可以做：

import numpy as np
import pandas as pd

def add_quotient(x):
    last_row = x.iloc[-1]
    last_row['COUNT'] = x[x.TYPE == 1].COUNT.min() / x[x.TYPE == 2].COUNT.max()
    last_row['TYPE'] = np.nan
    return x.append(last_row)


print(df.groupby('GROUP').apply(add_quotient))

產量

        GROUP  TYPE       COUNT
GROUP                          
A     0     A   1.0    5.000000
      1     A   2.0   10.000000
      1     A   NaN    0.500000
B     2     B   1.0    3.000000
      3     B   2.0    9.000000
      3     B   NaN    0.333333
C     4     C   1.0   20.000000
      5     C   2.0  100.000000
      5     C   NaN    0.200000

請注意，如果每個組有多個值，則函數選擇TYPE == 1的最小值TYPE == 1 ， TYPE == 1的最大值TYPE == 2 。 並且TYPE設置為np.nan ，但這可以很容易地改變。

Answer 4

這是首先使用sort_values' by '['GROUP', 'TYPE']以確保TYPE 2在1之前，然后是GroupBy GROUP 。

然后使用first和last來計算與df的quocient和外部合並：

g = df.sort_values(['GROUP', 'TYPE']).groupby('GROUP')
s = (g.first()/ g.nth(1)).COUNT.reset_index()
df.merge(s, on = ['GROUP','COUNT'], how='outer').fillna(' ').sort_values('GROUP')

   GROUP TYPE       COUNT
0     A    1    5.000000
1     A    2   10.000000
6     A         0.500000
2     B    1    3.000000
3     B    2    9.000000
7     B         0.333333
4     C    1   20.000000
5     C    2  100.000000
8     C         0.200000

pandas-列中每個唯一字符串/組的新計算行

問題描述

4 個解決方案

解決方案1
4 已采納 2019-01-03 16:56:36

解決方案2
2 2019-01-03 16:57:11

解決方案3
1 2019-01-03 16:55:11

解決方案4
1 2019-01-03 17:01:04

pandas-列中每個唯一字符串/組的新計算行

問題描述

4 個解決方案

解決方案1 4 已采納 2019-01-03 16:56:36

解決方案2 2 2019-01-03 16:57:11

解決方案3 1 2019-01-03 16:55:11

解決方案4 1 2019-01-03 17:01:04

解決方案1
4 已采納 2019-01-03 16:56:36

解決方案2
2 2019-01-03 16:57:11

解決方案3
1 2019-01-03 16:55:11

解決方案4
1 2019-01-03 17:01:04