繁体   English   中英

pandas - 数据框中出现的唯一行数

[英]pandas - number of unique rows occurrences in dataframe

如何计算DataFrame中每个唯一行的出现次数?

data = {'x1': ['A','B','A','A','B','A','A','A'], 'x2': [1,3,2,2,3,1,2,3]}
df = pd.DataFrame(data)

df
  x1  x2
0  A   1
1  B   3
2  A   2
3  A   2
4  B   3
5  A   1
6  A   2
7  A   3

我想获得

   x1  x2 count 
0   A   1     2
1   A   2     3
2   A   3     1
3   B   3     2

IIUC你可以将param as_index=False作为arg传递给groupby

In [100]:
df.groupby(['x1','x2'], as_index=False).count()

Out[100]:
  x1  x2  count
0  A   1      2
1  A   2      3
2  A   3      1
3  B   3      2

您还可以删除重复的行:

In [4]: df.shape[0]
Out[4]: 8

In [5]: df.drop_duplicates().shape[0]
Out[5]: 4

有两种方法可以在数据框中找到独特的出现。

第一:使用 drop_duplicates

df.drop_duplicates().sort_values('x1',ignore_index=True)

第二:使用 groupby.nunique

df.groupby(['x1','x2'], as_index=False).nunique()

为了查找出现次数,@EdChum 的答案将准确无误。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM