使用 Pandas 查找列的最大值並返回相應的行值

Question

數據結構；

使用 Python Pandas 我試圖找到具有最大值的Country和Place 。

這將返回最大值：

data.groupby(['Country','Place'])['Value'].max()

但是我如何獲得相應的Country和Place ？

Answer 1

假設df有一個唯一索引，這給出了具有最大值的行：

In [34]: df.loc[df['Value'].idxmax()]
Out[34]: 
Country        US
Place      Kansas
Value         894
Name: 7

請注意， idxmax返回索引標簽。 所以如果DataFrame在索引中有重復，標簽可能不會唯一標識該行，因此df.loc可能會返回多於一行。

因此，如果df沒有唯一索引，則必須在進行上述操作之前使索引唯一。 根據 DataFrame 的不同，有時您可以使用stack或set_index使索引唯一。 或者，您可以簡單地重置索引（因此行重新編號，從 0 開始）：

df = df.reset_index()

Answer 2

df[df['Value']==df['Value'].max()]

這將返回具有最大值的整行

Answer 3

我認為返回具有最大值的行的最簡單方法是獲取其索引。 argmax()可用於返回具有最大值的行的索引。

index = df.Value.argmax()

現在可以使用索引來獲取該特定行的特征：

df.iloc[df.Value.argmax(), 0:2]

Answer 4

country 和 place 是系列的索引，如果不需要索引，可以設置as_index=False ：

df.groupby(['country','place'], as_index=False)['value'].max()

編輯：

似乎您想要每個國家/地區都具有最大值的地方，以下代碼將執行您想要的操作：

df.groupby("country").apply(lambda df:df.irow(df.value.argmax()))

Answer 5

使用DataFrame的index屬性。 請注意，我沒有鍵入示例中的所有行。

In [14]: df = data.groupby(['Country','Place'])['Value'].max()

In [15]: df.index
Out[15]: 
MultiIndex
[Spain  Manchester, UK     London    , US     Mchigan   ,        NewYork   ]

In [16]: df.index[0]
Out[16]: ('Spain', 'Manchester')

In [17]: df.index[1]
Out[17]: ('UK', 'London')

您還可以通過該索引獲取值：

In [21]: for index in df.index:
    print index, df[index]
   ....:      
('Spain', 'Manchester') 512
('UK', 'London') 778
('US', 'Mchigan') 854
('US', 'NewYork') 562

編輯

抱歉誤解了您想要的內容，請嘗試以下操作：

In [52]: s=data.max()

In [53]: print '%s, %s, %s' % (s['Country'], s['Place'], s['Value'])
US, NewYork, 854

Answer 6

為了打印具有最大值的國家和地區，請使用以下代碼行。

print(df[['Country', 'Place']][df.Value == df.Value.max()])

Answer 7

您可以使用：

print(df[df['Value']==df['Value'].max()])

Answer 8

我在列中查找最大值的解決方案：

df.ix[df.idxmax()]

, 也是最小值：

df.ix[df.idxmin()]

Answer 9

我建議使用nlargest以獲得更好的性能和更短的代碼。 進口pandas

df[col_name].value_counts().nlargest(n=1)

Answer 10

進口大熊貓
df 是您創建的數據框。

使用命令：

df1=df[['Country','Place']][df.Value == df['Value'].max()]

這將顯示值最大的國家和地點。

Answer 11

我在嘗試使用 Pandas 導入數據時遇到了類似的錯誤，數據集的第一列在單詞開始前有空格。 我刪除了空格，它就像一個魅力！

Answer 12

使用`DataFrame.nlargest` 。

對此的專用方法是nlargest ，它在后台使用algorithm.SelectNFrame ，這是一種sort_values().head(n)方法： sort_values().head(n)

   x  y  a  b
0  1  2  a  x
1  2  4  b  x
2  3  6  c  y
3  4  1  a  z
4  5  2  b  z
5  6  3  c  z

df.nlargest(1, 'y')

   x  y  a  b
2  3  6  c  y

使用 Pandas 查找列的最大值並返回相應的行值

問題描述

12 個解決方案

解決方案1
205 已采納 2013-04-01 10:58:15

解決方案2
81 2018-04-30 17:07:24

解決方案3
14 2018-05-09 10:48:05

解決方案4
12 2013-04-01 10:50:04

解決方案5
9 2013-04-01 10:44:57

編輯

解決方案6
6 2018-02-20 06:53:42

解決方案7
4 2020-02-16 15:01:41

解決方案8
2 2019-01-14 21:12:12

解決方案9
2 2019-05-26 05:47:22

解決方案10
2 2020-03-23 07:22:45

解決方案11
0 2019-11-29 04:16:48

解決方案12
0 2021-03-10 12:18:10

使用`DataFrame.nlargest` 。

使用 Pandas 查找列的最大值並返回相應的行值

問題描述

12 個解決方案

解決方案1 205 已采納 2013-04-01 10:58:15

解決方案2 81 2018-04-30 17:07:24

解決方案3 14 2018-05-09 10:48:05

解決方案4 12 2013-04-01 10:50:04

解決方案5 9 2013-04-01 10:44:57

編輯

解決方案6 6 2018-02-20 06:53:42

解決方案7 4 2020-02-16 15:01:41

解決方案8 2 2019-01-14 21:12:12

解決方案9 2 2019-05-26 05:47:22

解決方案10 2 2020-03-23 07:22:45

解決方案11 0 2019-11-29 04:16:48

解決方案12 0 2021-03-10 12:18:10

使用DataFrame.nlargest 。

解決方案1
205 已采納 2013-04-01 10:58:15

解決方案2
81 2018-04-30 17:07:24

解決方案3
14 2018-05-09 10:48:05

解決方案4
12 2013-04-01 10:50:04

解決方案5
9 2013-04-01 10:44:57

解決方案6
6 2018-02-20 06:53:42

解決方案7
4 2020-02-16 15:01:41

解決方案8
2 2019-01-14 21:12:12

解決方案9
2 2019-05-26 05:47:22

解決方案10
2 2020-03-23 07:22:45

解決方案11
0 2019-11-29 04:16:48

解決方案12
0 2021-03-10 12:18:10

使用`DataFrame.nlargest` 。