Python DataFrame：基于另一列的出现次数

Question

我有一个 Python 团队数据框和他们取得的成绩（1、2 或 3）

我想操纵 df 看起来像下面这样。 所以这是一个团队达到每个地方的频率。

团队	1	2	3
一个	5	1	1
乙	0	2	0

Answer 1

您可以获取每个组的值计数，然后取消堆叠索引。 rest 正在转动以获得您的确切 output。

(df.groupby('Team')['place']
   .value_counts()
   .unstack(fill_value=0)
   .reset_index()
   .rename_axis(None, axis=1)
)

Answer 2

您可以使用pandas.crosstab ：

pd.crosstab(df['Team'], df['place'])

或简单的groupby + size和unstack ：

(df.groupby(['Team', 'place']).size()
   .unstack('place', fill_value=0)
)

output：

place  1  2  3
Team          
A      5  1  1
B      0  2  0

(pd.crosstab(df['Team'], df['place'])
   .rename_axis(columns=None)
   .reset_index()
)

output：

  Team  1  2  3
0   A   5  1  1
1   B   0  2  0