繁体   English   中英

Select Pandas dataframe 行,其中两列或多列一起具有最大值

[英]Select Pandas dataframe row where two or more columns have their maximum value together

假设你有一个pandas.DataFrame像这样:

机构 专长1 壮举2 壮举3 ...
ID1 14.5 0 0.32 ...
ID2 322.12 1 0.94 ...
ID3 27.08 0 1.47 ...

我的问题很简单:如何根据两列或多列的最大组合值从 dataframe 中获得一个 select 行。 例如:

  • 我想 select 列Feat1Feat3一起具有最大值的行,返回:
机构 专长1 壮举2 壮举3 ...
ID2 322.12 1 0.94 ...

我确信一个好的旧 for 循环可以解决这个问题,但我相信必须有一个 Pandas function ,希望有人指出我正确的方向。

你可以玩arround:

df.sum(axis=1)

df['row_sum'] = df.sum(axis=1)

或者

df['sum'] = df['col1' ] + df['col3']

接着:

df.sort(['sum' ],ascending=[False or True])

df.sort_index()

你可以用切片来做到这一点:

output = df.loc[(df['Feat1'] + df['Feat3']).to_frame().idxmax(),:]

这输出:

  Institution   Feat1  Feat2  Feat3
1         ID2  322.12      1   0.94

或者,您始终可以创建一个列并对其进行切片,但这需要一些额外的努力。

df['filter'] = df['Feat1'] + df['Feat3']
output = df[df['filter'] == df['filter'].max()]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM