簡體   English   中英

通過列值匯總Pandas DataFrame

[英]Summarize Pandas DataFrame by Column Values

我有一個Pandas DataFrame,每列都是一個二進制指示器1/0。 它有4列(和6行)。 我想產生一個DataFrame,將相似的行分組,最后(第5列)顯示適合該類別的行數。 請參閱以下示例:

df = pd.DataFrame([[0,1,1,0],
         [0,1,1,0],
         [0,0,0,1],
         [0,0,0,1],
         [1,1,1,0],
         [1,1,1,1],
         [1,1,1,0]])

res = pd.DataFrame([[0,1,1,0,2],
         [0,0,0,1,2],
         [1,1,1,0,2],
         [1,1,1,1,1]])

我需要從df創建“ res” DataFrame。

這是groupby + size

df.groupby(list(df)).size().to_frame('size').reset_index()
Out[612]: 
   0  1  2  3  size
0  0  0  0  1     2
1  0  1  1  0     2
2  1  1  1  0     2
3  1  1  1  1     1

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM