繁体   English   中英

当在pandas数据框中使用最大的数据时,是否可以忽略NaN值的列?

[英]When taking nlargest in pandas dataframe, is there a way to ignore column with NaN values?

当在pandas数据框中使用最大的数据时,是否可以忽略NaN值的列? 如果说我想选择具有5个最大值的5个列标题,并且如果某些列具有NaN值,则该列将被忽略。 如果具有有限值的列数小于5,则选择所有具有有限值(<5)的列标题。

nlargest采用按传递给该方法的columns降序排列的前n行。 如果有NaN值到达顶部,则它将包括这些值。 如果您想忽略排序依据的列中存在NaN值的行,请执行以下操作:

# assume a variable 'columns' exist that defines what columns to sort
# by.  You'll have to assign this yourself.  Also assign 'n' yourself.
df = df.dropna(subset=columns)
df = df.nlargest(n, columns=columns)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM