[英]Summarize Pandas DataFrame by Column Values
我有一個Pandas DataFrame,每列都是一個二進制指示器1/0。 它有4列(和6行)。 我想產生一個DataFrame,將相似的行分組,最后(第5列)顯示適合該類別的行數。 請參閱以下示例:
df = pd.DataFrame([[0,1,1,0],
[0,1,1,0],
[0,0,0,1],
[0,0,0,1],
[1,1,1,0],
[1,1,1,1],
[1,1,1,0]])
res = pd.DataFrame([[0,1,1,0,2],
[0,0,0,1,2],
[1,1,1,0,2],
[1,1,1,1,1]])
我需要從df創建“ res” DataFrame。
這是groupby
+ size
df.groupby(list(df)).size().to_frame('size').reset_index()
Out[612]:
0 1 2 3 size
0 0 0 0 1 2
1 0 1 1 0 2
2 1 1 1 0 2
3 1 1 1 1 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.