[英]Python DataFrame: count of occurances based on another column
我有一个 Python 团队数据框和他们取得的成绩(1、2 或 3)
团队 | 地方 |
---|---|
一个 | 1 |
一个 | 1 |
一个 | 1 |
一个 | 2 |
一个 | 3 |
一个 | 1 |
一个 | 1 |
乙 | 2 |
乙 | 2 |
我想操纵 df 看起来像下面这样。 所以这是一个团队达到每个地方的频率。
团队 | 1 | 2 | 3 |
---|---|---|---|
一个 | 5 | 1 | 1 |
乙 | 0 | 2 | 0 |
您可以获取每个组的值计数,然后取消堆叠索引。 rest 正在转动以获得您的确切 output。
(df.groupby('Team')['place']
.value_counts()
.unstack(fill_value=0)
.reset_index()
.rename_axis(None, axis=1)
)
您可以使用pandas.crosstab
:
pd.crosstab(df['Team'], df['place'])
或简单的groupby
+ size
和unstack
:
(df.groupby(['Team', 'place']).size()
.unstack('place', fill_value=0)
)
output:
place 1 2 3
Team
A 5 1 1
B 0 2 0
(pd.crosstab(df['Team'], df['place'])
.rename_axis(columns=None)
.reset_index()
)
output:
Team 1 2 3
0 A 5 1 1
1 B 0 2 0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.