在python中搜索列表的最快方法

Question

当你这样做"test" in a ，其中a是一个列表确实蟒蛇做了顺序搜索在名单上，它创建一个哈希表表示，以优化查询？ 在应用程序中我需要这个，因为我会在列表上进行大量的查找，所以最好做b = set(a)然后"test" in b吗？ 另请注意，我将拥有的值列表不会有重复数据，我实际上并不关心它的顺序; 我只需要能够检查是否存在值。

Answer 1

另请注意，我将拥有的值列表不会有重复数据，我实际上并不关心它的顺序; 我只需要能够检查是否存在值。

不要使用列表，而是使用set() 。 它正是你想要的属性，包括一个速度极快in测试。

我已经看到了20倍甚至更高的加速度（大多数是重数字运算），其中一个列表被更改为一组。

Answer 2

带有列表a "test" in a将进行线性搜索。 动态设置哈希表比线性搜索要昂贵得多。 另一方面"test" in b将进行amoirt化O（1）散列查找。

在您描述的情况下，似乎没有理由在集合上使用列表。

Answer 3

我认为最好采用set实现。 我知道集合有O（1）查找时间。 我认为列表需要O（n）查找时间。 但即使列表也是O（1）查找，切换到集合也不会丢失任何内容。

此外，集合不允许重复值。 这将使您的程序稍微提高内存效率

Answer 4

列表和元组似乎有相同的时间，使用“in”对大数据来说很慢：

>>> t = list(range(0, 1000000))
>>> a=time.time();x = [b in t for b in range(100234,101234)];print(time.time()-a)
1.66235494614
>>> t = tuple(range(0, 1000000))
>>> a=time.time();x = [b in t for b in range(100234,101234)];print(time.time()-a)
1.6594209671

这是更好的解决方案：在一个巨大的列表中查找/搜索的最有效方式（python）

这超级快：

>>> from bisect import bisect_left
>>> t = list(range(0, 1000000))
>>> a=time.time();x = [t[bisect_left(t,b)]==b for b in range(100234,101234)];print(time.time()-a)
0.0054759979248

在python中搜索列表的最快方法

问题描述

4 个解决方案

解决方案1
55 已采纳 2011-05-13 14:47:53

解决方案2
8 2011-05-13 14:48:50

解决方案3
1 2011-05-13 14:49:49

解决方案4
-1 2016-09-14 12:32:16

在python中搜索列表的最快方法

问题描述

4 个解决方案

解决方案1 55 已采纳 2011-05-13 14:47:53

解决方案2 8 2011-05-13 14:48:50

解决方案3 1 2011-05-13 14:49:49

解决方案4 -1 2016-09-14 12:32:16

解决方案1
55 已采纳 2011-05-13 14:47:53

解决方案2
8 2011-05-13 14:48:50

解决方案3
1 2011-05-13 14:49:49

解决方案4
-1 2016-09-14 12:32:16