Python：如何用零填充？

Question

假設我們有一個如下數據框：

df = pd.DataFrame({ 'Col1' : ['a', 'a', 'a', 'a', 'b', 'b', 'c', 'c'],
        'col2' : ['0.5', '0.78', '0.78', '0.4', '2', '9', '2', '7',]
        })

我計算了col1所有唯一值的行數。 像a具有4行， b和c各有，2行做：

df.groupby(['Col1']).size()

我把輸出作為

Col1
a    4
b    2
c    2
dtype: int64

完成此操作后，我想檢查a，b，c中哪一行具有最大行數（在這種情況下， a具有最大行數）並填充其他行（ b和c ）與最大值之間的差異值和它們擁有的行，用零（ b和c各有2行，因為4是最大行數，我想用b和c填充2個零）。 必須在末尾添加零。

我想用零填充它，因為我想在所有變量（a，b，c）上應用一個固定大小的窗口來繪制圖形。

Answer 1

您可以通過創建計數器GroupBy.cumcount ，建立MultiIndex和DataFrame.reindex由創建的所有組合MultiIndex.from_product ：

df1 = df.set_index(['Col1', df.groupby('Col1').cumcount()])

mux = pd.MultiIndex.from_product(df1.index.levels, names=df1.index.names)
df2 = df1.reindex(mux, fill_value=0).reset_index(level=1, drop=True).reset_index()
print (df2)
   Col1  col2
0     a   0.5
1     a  0.78
2     a  0.78
3     a   0.4
4     b     2
5     b     9
6     b     0
7     b     0
8     c     2
9     c     7
10    c     0
11    c     0

Answer 2

使用相同的邏輯狀Jez的cumcount ，但與stack和unstack鏈

df.assign(key2=df.groupby('Col1').cumcount()).set_index(['Col1','key2']).unstack(fill_value=0).stack().reset_index('Col1')
Out[1047]: 
     Col1  col2
key2           
0       a   0.5
1       a  0.78
2       a  0.78
3       a   0.4
0       b     2
1       b     9
2       b     0
3       b     0
0       c     2
1       c     7
2       c     0
3       c     0

Python：如何用零填充？

問題描述

2 個解決方案

解決方案1
2 已采納 2019-03-21 13:34:29

解決方案2
1 2019-03-21 13:50:31

Python：如何用零填充？

問題描述

2 個解決方案

解決方案1 2 已采納 2019-03-21 13:34:29

解決方案2 1 2019-03-21 13:50:31

解決方案1
2 已采納 2019-03-21 13:34:29

解決方案2
1 2019-03-21 13:50:31