Pandas 獲取列的最頻繁值

Question

我有這個數據框：

0 name data
1 alex asd
2 helen sdd
3 alex dss
4 helen sdsd
5 john sdadd

所以我試圖獲得最常見的值或值（在這種情況下是它的值）所以我要做的是：

dataframe['name'].value_counts().idxmax()

但它只返回值： Alex ，即使它Helen也出現了兩次。

Answer 1

通過使用mode

df.name.mode()
Out[712]: 
0     alex
1    helen
dtype: object

Answer 2

要獲得n最頻繁的值，只需使用.value_counts()子集並獲取索引：

# get top 10 most frequent names
n = 10
dataframe['name'].value_counts()[:n].index.tolist()

Answer 3

你可以像這樣嘗試argmax ：

dataframe['name'].value_counts().argmax() Out[13]: 'alex'

該value_counts將返回的計數對象pandas.core.series.Series和argmax可用於實現最大價值的關鍵。

Answer 4

df['name'].value_counts()[:5].sort_values(ascending=False)

value_counts將返回pandas.core.series.Series的計數對象，而sort_values(ascending=False)將首先獲得最高值。

Answer 5

您可以使用它來獲得完美計數，它計算特定列的模式

df['name'].value_counts()

Answer 6

這是一種方法：

df['name'].value_counts()[df['name'].value_counts() == df['name'].value_counts().max()]

打印：

helen    2
alex     2
Name: name, dtype: int64

Answer 7

不明顯，但很快

f, u = pd.factorize(df.name.values)
counts = np.bincount(f)
u[counts == counts.max()]

array(['alex', 'helen'], dtype=object)

Answer 8

獲得前 5 名：

dataframe['name'].value_counts()[0:5]

Answer 9

用：

df['name'].mode()

或者

df['name'].value_counts().idxmax()

Answer 10

您可以使用 .apply 和 pd.value_counts 來計算名稱列中所有名稱的出現次數。

dataframe['name'].apply(pd.value_counts)

Answer 11

要獲得前五個最常見的名稱：

dataframe['name'].value_counts().head()

Answer 12

我獲得第一個的最佳解決方案是

 df['my_column'].value_counts().sort_values(ascending=False).argmax()

Answer 13

簡單地使用這個..

dataframe['name'].value_counts().nlargest(n)

頻率最大和最小的函數是：

nlargest()用於最頻繁的 'n' 值
nsmallest()用於最不頻繁的“n”值

Answer 14

我有一個類似的問題，最好最緊湊的答案讓我們說前 n（默認為 5）最常見的值是：

df["column_name"].value_counts().head(n)

Answer 15

確定前 5 個，例如，使用 value_counts

top5 = df['column'].value_counts()

列出“top_5”的內容

top5[:5]

Answer 16

n 用於獲取最頻繁使用的項目的數量

n = 2

a=dataframe['name'].value_counts()[:n].index.tolist()

dataframe["name"].value_counts()[a]

Answer 17

獲得前 5 名最常見的姓氏熊貓：

df['name'].apply(lambda name: name.split()[-1]).value_counts()[:5]

Answer 18

它將給出前五個最常見的名稱：

df['name'].value_counts().nlargest(5)

Pandas 獲取列的最頻繁值

問題描述

18 個解決方案

解決方案1
102 已采納 2018-02-02 20:23:55

解決方案2
55 2019-04-28 06:47:16

解決方案3
17 2018-06-27 02:57:02

解決方案4
9 2019-09-11 08:32:42

解決方案5
7 2018-08-15 05:18:32

解決方案6
6 2018-02-02 20:22:33

解決方案7
4 2018-02-02 20:34:46

解決方案8
4 2019-07-02 09:03:54

解決方案9
3 2020-07-06 09:15:39

解決方案10
2 2018-02-02 20:24:55

解決方案11
2 2019-07-30 05:41:50

解決方案12
2 2020-01-30 15:13:44

解決方案13
2 2020-05-02 20:00:13

解決方案14
2 2021-03-12 14:50:54

解決方案15
2 2021-06-18 16:53:54

解決方案16
1 2020-12-16 14:10:29

n 用於獲取最頻繁使用的項目的數量

解決方案17
0 2021-08-11 15:34:34

解決方案18
0 2022-01-21 07:25:45

Pandas 獲取列的最頻繁值

問題描述

18 個解決方案

解決方案1 102 已采納 2018-02-02 20:23:55

解決方案2 55 2019-04-28 06:47:16

解決方案3 17 2018-06-27 02:57:02

解決方案4 9 2019-09-11 08:32:42

解決方案5 7 2018-08-15 05:18:32

解決方案6 6 2018-02-02 20:22:33

解決方案7 4 2018-02-02 20:34:46

解決方案8 4 2019-07-02 09:03:54

解決方案9 3 2020-07-06 09:15:39

解決方案10 2 2018-02-02 20:24:55

解決方案11 2 2019-07-30 05:41:50

解決方案12 2 2020-01-30 15:13:44

解決方案13 2 2020-05-02 20:00:13

解決方案14 2 2021-03-12 14:50:54

解決方案15 2 2021-06-18 16:53:54

解決方案16 1 2020-12-16 14:10:29

n 用於獲取最頻繁使用的項目的數量

解決方案17 0 2021-08-11 15:34:34

解決方案18 0 2022-01-21 07:25:45

解決方案1
102 已采納 2018-02-02 20:23:55

解決方案2
55 2019-04-28 06:47:16

解決方案3
17 2018-06-27 02:57:02

解決方案4
9 2019-09-11 08:32:42

解決方案5
7 2018-08-15 05:18:32

解決方案6
6 2018-02-02 20:22:33

解決方案7
4 2018-02-02 20:34:46

解決方案8
4 2019-07-02 09:03:54

解決方案9
3 2020-07-06 09:15:39

解決方案10
2 2018-02-02 20:24:55

解決方案11
2 2019-07-30 05:41:50

解決方案12
2 2020-01-30 15:13:44

解決方案13
2 2020-05-02 20:00:13

解決方案14
2 2021-03-12 14:50:54

解決方案15
2 2021-06-18 16:53:54

解決方案16
1 2020-12-16 14:10:29

解決方案17
0 2021-08-11 15:34:34

解決方案18
0 2022-01-21 07:25:45