繁体   English   中英

我可以在Python列表推导中使用别名来防止它们被多次评估吗?

[英]Can I alias expressions inside Python list comprehensions to prevent them being evaluated multiple times?

我发现自己经常想写这样的Python列表理解:

nearbyPoints = [(n, delta(n,x)) for n in allPoints if delta(n,x)<=radius]

这有希望给出一些关于我为什么要这样做的背景,但是也有一些情况需要为每个元素计算/比较多个值:

newlist = [(x,f(x),g(f(x))) for x in bigList if f(x)<p and g(f(x))<q]

所以我有两个问题:

  1. 是否会多次评估所有这些函数还是缓存结果? 语言是指定还是特定于实现? 我现在使用2.6,但3.x会不同吗?
  2. 有没有更简洁的方式来写它? 有时f和g是长表达式,重复是容易出错并且看起来很混乱。 我真的希望能够写下这个:
newList = [(x,a=f(x),b=g(a)) for x in bigList if a<p and b<q]

但这不起作用。 是否有充分的理由不支持这种语法? 可以通过它有点像做这个 或者我只需要使用多个listcomp或for循环?

我有一个hack在list / dict comprehensions中创建别名。 您可以for alias_name in [alias_value]技巧中使用for alias_name in [alias_value] 例如,你有这个昂贵的功能:

def expensive_function(x):
    print("called the very expensive function, that will be $2")
    return x*x + x

还有一些数据:

data = [4, 7, 3, 7, 2, 3, 4, 7, 3, 1, 1 ,1]

然后你想在每个元素上应用昂贵的函数,并根据它进行过滤。 你做的是:

result = [
    (x, expensive)
    for x in data
    for expensive in [expensive_function(x)] #alias
    if expensive > 3
]

print(result)

第二个for只会遍历大小为1的列表,有效地使其成为别名。 输出将显示昂贵的函数被调用12次,每个数据元素只调用一次。 然而,函数的结果(最多)使用两次,一次用于滤波器,一次用于输出。

请始终确保使用像我这样的多行来布局这样的理解,并将#alias附加到别名所在的行。 如果你使用别名,那么理解就会变得非常复杂,你应该帮助未来的代码读者获得你正在做的事情。 这不是perl,你知道;)。

为了完整性,输出:

called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
[(4, 20), (7, 56), (3, 12), (7, 56), (2, 6), (3, 12), (4, 20), (7, 56), (3, 12)]

代码: http//ideone.com/7mUQUt

关于#1,是的,它们将被多次评估。

关于#2,这样做的方法是计算和过滤单独的理解:

简明版:

[(x,fx,gx) for (x,fx,gx) in ((x,fx,g(fx)) for (x,fx) in ((x,f(x)) for x in bigList) if fx < p) if gx<q]

更长的版本扩展到更容易遵循:

[(x,f,g) for (x,f,g) in
  ((x,f,g(f)) for (x,f) in
     ((x,f(x)) for x in bigList)
  if f < p)
if g<q]

这将尽可能少地调用fg (每个f(x)值不是< p将永远不会调用g ,并且f将仅对bigList每个值调用一次)。

如果您愿意,还可以使用中间变量获得更整洁的代码:

a = ( (x,f(x)) for x in bigList )
b = ( (x,fx,g(fx)) for (x,fx) in a if fx<p )
results = [ c for c in b if c[2] < q ] # faster than writing out full tuples

ab使用生成器表达式,这样它们就不必实际实例化列表,只需在必要时进行评估。

随着列表理解变得更加复杂,它们也开始变得非常难以阅读。 在这种情况下,通常最好将其内部转换为生成器函数,并为它们提供(希望)有意义的名称。

# First example
def getNearbyPoints(x, radius, points):
    """Yields points where 'delta(x, point) <= radius'"""
    for p in points:
        distance = delta(p, x)
        if distance <= radius:
            yield p, distance

nearbyPoints = list(getNearbyPoints(x, radius, allPoints))


# Second example
def xfg(data, p, q):
    """Yield 3-tuples of x, f(x), g(f(x))"""
    for x in data:
        f = f(x)
        if f < p:
            g = g(f)
            if g < q:
                yield x, f, g

newList = list(xfg(bigList, p, q))
  1. 如果在表达式中调用两次函数(包括在列表推导中),它实际上将被调用两次。 Python无法知道您的函数是纯函数还是程序函数。 它告诉它,在这种情况下,它会两次调用它。

  2. 没有办法在列表推导中分配变量,因为在Python中,赋值是一个语句,而不是表达式。

听起来你应该使用完整的循环,而不是列表理解。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM