[英]When taking nlargest in pandas dataframe, is there a way to ignore column with NaN values?
当在pandas数据框中使用最大的数据时,是否可以忽略NaN值的列? 如果说我想选择具有5个最大值的5个列标题,并且如果某些列具有NaN值,则该列将被忽略。 如果具有有限值的列数小于5,则选择所有具有有限值(<5)的列标题。
nlargest
采用按传递给该方法的columns
降序排列的前n行。 如果有NaN值到达顶部,则它将包括这些值。 如果您想忽略排序依据的列中存在NaN值的行,请执行以下操作:
# assume a variable 'columns' exist that defines what columns to sort
# by. You'll have to assign this yourself. Also assign 'n' yourself.
df = df.dropna(subset=columns)
df = df.nlargest(n, columns=columns)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.