pandas - 數據框中出現的唯一行數

Question

如何計算DataFrame中每個唯一行的出現次數？

data = {'x1': ['A','B','A','A','B','A','A','A'], 'x2': [1,3,2,2,3,1,2,3]}
df = pd.DataFrame(data)

df
  x1  x2
0  A   1
1  B   3
2  A   2
3  A   2
4  B   3
5  A   1
6  A   2
7  A   3

我想獲得

   x1  x2 count 
0   A   1     2
1   A   2     3
2   A   3     1
3   B   3     2

Answer 1

IIUC你可以將param as_index=False作為arg傳遞給groupby ：

In [100]:
df.groupby(['x1','x2'], as_index=False).count()

Out[100]:
  x1  x2  count
0  A   1      2
1  A   2      3
2  A   3      1
3  B   3      2

Answer 2

您還可以刪除重復的行：

In [4]: df.shape[0]
Out[4]: 8

In [5]: df.drop_duplicates().shape[0]
Out[5]: 4

Answer 3

有兩種方法可以在數據框中找到獨特的出現。

第一：使用 drop_duplicates

df.drop_duplicates().sort_values('x1',ignore_index=True)

第二：使用 groupby.nunique

df.groupby(['x1','x2'], as_index=False).nunique()

為了查找出現次數，@EdChum 的答案將准確無誤。

pandas - 數據框中出現的唯一行數

問題描述

3 個解決方案

解決方案1
7 已采納 2016-11-11 15:50:18

解決方案2
3 2016-11-15 14:44:46

解決方案3
0 2022-07-19 09:41:40

pandas - 數據框中出現的唯一行數

問題描述

3 個解決方案

解決方案1 7 已采納 2016-11-11 15:50:18

解決方案2 3 2016-11-15 14:44:46

解決方案3 0 2022-07-19 09:41:40

解決方案1
7 已采納 2016-11-11 15:50:18

解決方案2
3 2016-11-15 14:44:46

解決方案3
0 2022-07-19 09:41:40