[英]Time to assign a variable in Python
假设我有一个非常紧密的循环:
a = func(x)
b = func2(a)
变量a
不在其他任何地方使用。
是否Python的自动编译掉分配给a
呢,还是走的时候每次都做变量赋值? 换句话说,此代码是否相同,还是由于缺少分配给a
速度略快?
b = func2(func(x))
Python2.7和Python3的行为是否相同?
因此,使用非常有趣的dis
模块,我们可以查看从您提供的python代码生成的实际字节码。 为了简单func2
,我用内置函数( int
和float
)替换了func
和func2
。
因此,我们的来源如下所示:
def assign():
a = int()
b = float(a)
与简化版本:
def simple():
b = float(int())
然后从cpython 2.7解释器开始,我们可以看到从assign
函数生成的字节码:
dis.dis(assign)
2 0 LOAD_GLOBAL 0 (int)
3 CALL_FUNCTION 0
6 STORE_FAST 0 (a)
3 9 LOAD_GLOBAL 1 (float)
12 LOAD_FAST 0 (a)
15 CALL_FUNCTION 1
18 STORE_FAST 1 (b)
21 LOAD_CONST 0 (None)
24 RETURN_VALUE
如您所见,没有窥视孔优化来删除不必要的中间变量,与简化的简单方法的字节码相比,这会导致额外的2条指令( STORE_FAST a
, LOAD_FAST a
):
dis.dis(simple)
2 0 LOAD_GLOBAL 0 (float)
3 LOAD_GLOBAL 1 (int)
6 CALL_FUNCTION 0
9 CALL_FUNCTION 1
12 STORE_FAST 0 (b)
15 LOAD_CONST 0 (None)
18 RETURN_VALUE
对于适用于Python 3.5的CPython解释器和适用于Python 2.7的pypy解释器,这是相同的。
使用dis模块比较字节码:看起来第二种方法产生较少的操作
import dis
print(dis.dis('a=f(2);b=g(a)'))
print(dis.dis('b=g(f(2))'))
>>>
1 0 LOAD_NAME 0 (f)
2 LOAD_CONST 0 (2)
4 CALL_FUNCTION 1
6 STORE_NAME 1 (a)
8 LOAD_NAME 2 (g)
10 LOAD_NAME 1 (a)
12 CALL_FUNCTION 1
14 STORE_NAME 3 (b)
16 LOAD_CONST 1 (None)
18 RETURN_VALUE
None
1 0 LOAD_NAME 0 (g)
2 LOAD_NAME 1 (f)
4 LOAD_CONST 0 (2)
6 CALL_FUNCTION 1
8 CALL_FUNCTION 1
10 STORE_NAME 2 (b)
12 LOAD_CONST 1 (None)
14 RETURN_VALUE
None
可以使用timeit
轻松检查此类查询。 这是Python2.7
的结果。
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; a=f1(2); b=f2(a)"
1000000 loops, best of 3: 0.29 usec per loop
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; b=f2(f1(2))"
1000000 loops, best of 3: 0.284 usec per loop
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; a=f1(2); b=f2(a)"
1000000 loops, best of 3: 0.285 usec per loop
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; b=f2(f1(2))"
1000000 loops, best of 3: 0.283 usec per loop
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; a=f1(2); b=f2(a)"
1000000 loops, best of 3: 0.294 usec per loop
root:/var# python -m timeit "f1 = lambda x:x; f2 = lambda x: x*2; b=f2(f1(2))"
1000000 loops, best of 3: 0.286 usec per loop
并且这与描述使用真棒dis
模块的其他答案显示出一致的结果。
实际时间将取决于func()
和func2()
函数的作用。 不是最好的例子,但是下面给出了一个快速(又脏)的测试代码:
import time
def func(x):
return 5
def func2(a):
return 10
t0 = time.time()
x = 10
for i in range(1,10000):
a = func(x)
b = func2(a)
t1 = time.time()
print("Time 1: ", t1-t0)
t2 = time.time()
x = 10
for i in range(1,10000):
b = func2(func(x))
t3 = time.time()
print("Time 2: ", t3-t2)
上面代码的输出是:
Time 1: 0.0029211044311523438
Time 2: 0.002785921096801758
所以是的,在Pyhton 3中,避免分配a
要快一些。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.