如果a == b或a == c：vs if in {b，c}：

Question

在我的代码中，我过去常常进行比较，如if a == b or a == c or a == d:相当频繁。 在某些时候，我发现if a in {b, c, d}:或者if a in (b, c, d): ，这些可以很容易地缩短到if a in (b, c, d):如果值不可清除。 但是，我从来没有在别人的代码中看到过这样的结构。 这可能是因为：

==方式比较慢。
==方式更加pythonic。
他们实际上做了微妙的不同的事情。
我偶然没有看过任何需要的代码。
我已经看过了，只是忽略或忘记了它。
人们不应该像这样进行比较，因为其他人的代码应该更好。
~~没有人想到了in除我之外的方式。~~

这是什么原因，是吗？

Answer 1

对于简单值（即非表达式或NaN s）， if a == b or a == c并且if a in <iterable of b and c>是等价的。

如果值是哈希的，最好是用in与文字而不是元组或列表文字一套：

if a in {b, c}: ...

CPython的窥孔优化器通常能够用缓存的frozenset()对象替换它，对集合的成员资格测试是O（1）操作。

Answer 2

Performancewise：“in”更好

timeit.timeit("pub='1'; pub == 1 or pub == '1'")
0.07568907737731934
timeit.timeit("pub='1'; pub in[1, '1']")
0.04272890090942383
timeit.timeit("pub=1; pub == 1 or pub == '1'")
0.07502007484436035
timeit.timeit("pub=1; pub in[1, '1']")
0.07035684585571289

同样“in”确保代码不重复== 1或a == 2是重复。 而且阅读不好。 “in”只是让它更容易理解。 这是简单而优雅的代码实践的案例之一。 简而言之，如果我们还没有使用它，我们应该更频繁地使用“in”。

Answer 3

我很想知道直接比较与阵列检查之间的时间差异。

结论： 构建阵列的成本并不是免费的，在考虑速度差异时必须考虑到这一点。

如果在比较时构造阵列，则技术上比简单比较慢。 因此，简单的比较可以更快地进出循环。

也就是说，如果已经构造了数组，那么在一个大循环中检查数组比进行简单比较更快。

$ speed.py
inarray                   x 1000000:  0.277590343844
comparison                x 1000000:  0.347808290754
makearray                 x 1000000:  0.408771123295

import timeit

NUM = 1000000

a = 1
b = 2
c = 3
d = 1

array = {b,c,d}
tup = (b,c,d)
lst = [b,c,d]

def comparison():
    if a == b or a == c or a == d:
        pass

def makearray():
    if a in {b, c, d}:
        pass

def inarray():
    if a in array:
        pass

def maketuple():
    if a in (b,c,d):
        pass

def intuple():
    if a in tup:
        pass

def makelist():
    if a in [b,c,d]:
        pass

def inlist():
    if a in lst:
        pass


def time_all(funcs, params=None):
    timers = []
    for func in funcs:
        if params:
            tx = timeit.Timer(lambda: func(*params))
        else:
            tx = timeit.Timer(lambda: func())
        timers.append([func, tx.timeit(NUM)])

    for func, speed in sorted(timers, key=lambda x: x[1]):
        print "{fn:<25} x {n}: ".format(fn=func.func_name, n=NUM), speed
    print ""
    return

time_all([comparison,
          makearray,
          inarray,
          intuple,
          maketuple,
          inlist,
          makelist
          ], 
         )

这并没有完全回答你的问题，为什么你不经常看到使用的比较。我会猜测，但它可能是1,2,4的混合，以及作者需要写的情况特定的代码。

我个人根据具体情况使用这两种方法。 选择通常归结为速度或简单性。

编辑：

@ bracco23是对的，使用元组vs阵列vs列表会有一些细微的差别会改变时间。

$ speed.py
inarray                   x 1000000:  0.260784980761
intuple                   x 1000000:  0.288696420718
inlist                    x 1000000:  0.311479982167
maketuple                 x 1000000:  0.356532747578
comparison                x 1000000:  0.360010093964
makearray                 x 1000000:  0.41094386108
makelist                  x 1000000:  0.433603059099

如果a == b或a == c：vs if in {b，c}：

问题描述

3 个解决方案

解决方案1
4 已采纳 2017-08-21 15:09:09

解决方案2
2 2017-08-21 15:15:06

解决方案3
2 2017-08-21 15:35:08

如果a == b或a == c：vs if in {b，c}：

问题描述

3 个解决方案

解决方案1 4 已采纳 2017-08-21 15:09:09

解决方案2 2 2017-08-21 15:15:06

解决方案3 2 2017-08-21 15:35:08

解决方案1
4 已采纳 2017-08-21 15:09:09

解决方案2
2 2017-08-21 15:15:06

解决方案3
2 2017-08-21 15:35:08