如何在 Python 中对相同的值进行分组并计算它们的频率？

Question

我有一个包含 2 列的 dataframe

source_number   category
   222             cat2
   123             cat4
   111             cat1
   321             cat3
   543             cat1
   542             cat4
   333             cat1
   343             cat2

我根据 Amiga500 的答案编辑function我运行以下代码：

s = df["category"].value_counts()
print(s)

返回结果：

cat1 1
cat1 2    
cat2 1
cat2 1
cat3 1
cat4 2

预期结果：

cat1 3    
cat2 2
cat3 1
cat4 2

此语句中的错误在哪里以及如何解决？

Answer 1

看起来您的列中有一些whitespaces 。 尝试使用str.strip()删除前导和尾随字符（包括空格）：

df['category'].value_counts()
Out[364]: 
cat4     2
cat1     2
cat2     1
cat3     1
cat2     1
cat1     1

# With using str.strip()
df['category'].str.strip().value_counts()
Out[365]: 
cat1    3
cat2    2
cat4    2
cat3    1

Answer 2

这个？

df['cat'].value_counts()

编辑：

基于上面现在介绍的 dataframe，代码应为：

df['category'].value_counts()

如何在 Python 中对相同的值进行分组并计算它们的频率？

问题描述

返回结果：

预期结果：

2 个解决方案

解决方案1
1 已采纳 2021-03-30 08:13:45

解决方案2
0 2021-03-29 10:54:42

如何在 Python 中对相同的值进行分组并计算它们的频率？

问题描述

返回结果：

预期结果：

2 个解决方案

解决方案1 1 已采纳 2021-03-30 08:13:45

解决方案2 0 2021-03-29 10:54:42

解决方案1
1 已采纳 2021-03-30 08:13:45

解决方案2
0 2021-03-29 10:54:42