计算熊猫中相应值的频率[python 3]

Question

I have the dataset with the following values: 我的数据集具有以下值：

var1  var2 
1234  abc
2345  bcs
5678  csd
1234  abc
1234  bcs
5678  csd
1234  bcs
1234  xyz
1234  abc
9101  zzz

I need for every unique value in column var1 to count and show the top 3 frequency counts of the corresponding values in var2, and get the output, for example: 我需要对var1列中的每个唯一值进行计数，并显示var2中相应值的前3个频率计数，并获取输出，例如：

var1  var2  count
1234  abc   3
1234  bcs   2
1234  xyz   1
5678  csd   2
9101  zzz   1

What's the most efficient way of doing that? 最有效的方法是什么？

Answer 1

You need to include nlargest 您需要包括nlargest

df.groupby('var1').var2.apply(lambda x: x.value_counts().nlargest(3)) \
    .reset_index(name='count').rename(columns={'level_1': 'var2'})

   var1 var2  count
0  1234  abc      3
1  1234  bcs      2
2  1234  xyz      1
3  2345  bcs      1
4  5678  csd      2
5  9101  zzz      1

Answer 2

df_a.groupby(['var1','var2'])['var2'].agg({'count':'count'}).reset_index()

Answer 3

这工作：

df.groupby(['var1','var2']).count()

计算熊猫中相应值的频率[python 3]

问题描述

3 个解决方案

解决方案1
2 已采纳 2017-03-20 07:19:26

解决方案2
1 2017-03-19 20:30:22

解决方案3
0 2017-03-19 20:49:57

计算熊猫中相应值的频率[python 3]

问题描述

3 个解决方案

解决方案1 2 已采纳 2017-03-20 07:19:26

解决方案2 1 2017-03-19 20:30:22

解决方案3 0 2017-03-19 20:49:57

解决方案1
2 已采纳 2017-03-20 07:19:26

解决方案2
1 2017-03-19 20:30:22

解决方案3
0 2017-03-19 20:49:57