使用MultiIndex將值的子集分配給pandas數據框

Question

我有一個DataFrame df ：

                             **Count**
**Environment** **Type**    
**A**            a           100
                 b           200
                 c           300
                 d           400
                 e           500
                 f           600
**B**            a           1000
                 b           2000
                 c           3000
                 d           4000
                 e           5000
                 f           6000

df.index吐出以下索引：

    MultiIndex(levels=[['A', 'B'], ['a', 'b', 'c', 'd', 'e', 'f']],
               labels=[[0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1], 
                       [0, 1, 2, 3, 4, 5, 0, 1, 2, 3, 4, 5]],
               names=['A', 'B'])

我需要計算每個A和B的計數百分比。所以我這樣做：

sums = df.groupby(level = 0).sum()
df.loc['A'] = df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'] = df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])

但是，這導致所有值均為NaN 。

我懷疑df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])的索引與df的索引不同，但應該是與我選擇的df部分相同。

這些都是他們自己

df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])

擁有我需要的價值，因此划分有效。 但是，分配不是。

如何將上述表達式的結果分配給數據幀 df 的一部分 ？

Answer 1

使用div分配值

s=df.Count.div(df.Count.sum(level=0),axis=0,level=0)
df['per']=s
df
Out[1253]: 
                          Count       per
**Environment** **Type**                 
A               a           100  0.047619
                b           200  0.095238
                c           300  0.142857
                d           400  0.190476
                e           500  0.238095
                f           600  0.285714
B               a          1000  0.047619
                b          2000  0.095238
                c          3000  0.142857
                d          4000  0.190476
                e          5000  0.238095
                f          6000  0.285714

Answer 2

您可以簡單地執行df/sums ，而無需循環。

由於您要分配給數據框的特定部分，因此可以使用這種方法。 保持較高的df 1級深度。

df.loc['A',:] = df.loc['A',:,:].apply(lambda x: x/sums.loc['A','Count'])

使用MultiIndex將值的子集分配給pandas數據框

問題描述

2 個解決方案

解決方案1
2 2018-12-10 15:00:24

解決方案2
2 已采納 2018-12-10 15:06:28

使用MultiIndex將值的子集分配給pandas數據框

問題描述

2 個解決方案

解決方案1 2 2018-12-10 15:00:24

解決方案2 2 已采納 2018-12-10 15:06:28

解決方案1
2 2018-12-10 15:00:24

解決方案2
2 已采納 2018-12-10 15:06:28