[英]Find second largest element in list with repeated elements
我有一个列表,其中故意设置了几个非常大的值以区分那些索引,看起来像这样:
a = [1.3, 2.1, 9999., 5., 3.7 ,6.6, 9999., 7.4, 9999., 3.5, 7, 1.2, 9999.]
我需要以尽可能最有效的方式在该列表中找到第二个最大值,该最大值不等于9999.
(在上述情况下为7.4
)(我的列表会变得很大)
在此问题中,从包含100,000个整数的列表中检索出两个最高的项目,但提到了heapq.nlargest
函数,但是由于我有多个值9999.
所以它将不起作用。
这是另一种方法:
>>> a = [1.3, 2.1, 9999., 5., 3.7 ,6.6, 9999., 7.4, 9999., 3.5, 7, 1.2, 9999.]
>>> sorted(set(a))[-2]
7.4
>>>
而且,信不信由你,它实际上比公认的解决方案快很多:
>>> from timeit import timeit
>>> timeit("a=range(10000000);print sorted(set(a))[-2]", number=10)
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
34.327036257401424
>>> # This is NPE's answer
>>> timeit("a=range(10000000);maxa = max(a);print max(val for val in a if val != maxa)", number=10)
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
9999998
53.22811809880869
>>>
上面的测试可以运行10次,并且可以处理包含10,000,000个项目的列表。 除非测试中存在缺陷(我认为没有缺陷),否则我提供的解决方案显然要快得多。
>>> max(val for val in a if val != 9999)
7.4
这具有O(n)
时间复杂度。
如果9999
不是固定的,则可以使用max(a)
而不是9999
来泛化它:
>>> maxa = max(a)
>>> max(val for val in a if val != maxa)
7.4
(尽管我怀疑这不是您想要的。)
a = set([1.3, 2.1, 9999., 5., 3.7 ,6.6, 9999., 7.4, 9999., 3.5, 7, 1.2, 9999.])
a.remove(max(a))
print max(a)
这使用set
来确保我们只处理唯一的项目,然后删除最大值,以便下次调用max
,将剩下第二个最佳最大值。
如果要使用numpy,则可以使用掩码数组跳过“错误”值:
import numpy as np
a = np.array([1.3, 2.1, 9999., 5., 3.7 ,6.6, 9999., 7.4, 9999., 3.5, 7, 1.2, 9999.])
ma = np.ma.masked_values(a, 9999., copy=False)
ma.max()
7.4
您可以轻松地将排除项添加到蒙版中:
ma = np.ma.masked_values(ma, 7.4, copy=False)
ma.max()
7.0
ma.mask[ma>=5]=True
ma.max()
3.7
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.