Select Pandas dataframe 行，其中兩列或多列一起具有最大值

Question

假設你有一個pandas.DataFrame像這樣：

機構	專長1	壯舉2	壯舉3	...
ID1	14.5	0	0.32	...
ID2	322.12	1	0.94	...
ID3	27.08	0	1.47	...

我的問題很簡單：如何根據兩列或多列的最大組合值從 dataframe 中獲得一個 select 行。 例如：

機構	專長1	壯舉2	壯舉3	...
ID2	322.12	1	0.94	...

我確信一個好的舊 for 循環可以解決這個問題，但我相信必須有一個 Pandas function ，希望有人指出我正確的方向。

Answer 1

你可以玩arround：

df.sum(axis=1)

df['row_sum'] = df.sum(axis=1)

或者

df['sum'] = df['col1' ] + df['col3']

接着：

df.sort(['sum' ],ascending=[False or True])

df.sort_index()

Answer 2

你可以用切片來做到這一點：

output = df.loc[(df['Feat1'] + df['Feat3']).to_frame().idxmax(),:]

這輸出：

  Institution   Feat1  Feat2  Feat3
1         ID2  322.12      1   0.94

或者，您始終可以創建一個列並對其進行切片，但這需要一些額外的努力。

df['filter'] = df['Feat1'] + df['Feat3']
output = df[df['filter'] == df['filter'].max()]