我可以在Python列表推导中使用别名来防止它们被多次评估吗？

Question

我发现自己经常想写这样的Python列表理解：

nearbyPoints = [(n, delta(n,x)) for n in allPoints if delta(n,x)<=radius]

这有希望给出一些关于我为什么要这样做的背景，但是也有一些情况需要为每个元素计算/比较多个值：

newlist = [(x,f(x),g(f(x))) for x in bigList if f(x)<p and g(f(x))<q]

所以我有两个问题：

是否会多次评估所有这些函数还是缓存结果？ 语言是指定还是特定于实现？ 我现在使用2.6，但3.x会不同吗？
有没有更简洁的方式来写它？ 有时f和g是长表达式，重复是容易出错并且看起来很混乱。 我真的希望能够写下这个：

newList = [(x,a=f(x),b=g(a)) for x in bigList if a<p and b<q]

但这不起作用。 是否有充分的理由不支持这种语法？ 可以通过它有点像做这个？ 或者我只需要使用多个listcomp或for循环？

Answer 1

我有一个hack在list / dict comprehensions中创建别名。 您可以for alias_name in [alias_value]技巧中使用for alias_name in [alias_value] 。 例如，你有这个昂贵的功能：

def expensive_function(x):
    print("called the very expensive function, that will be $2")
    return x*x + x

还有一些数据：

data = [4, 7, 3, 7, 2, 3, 4, 7, 3, 1, 1 ,1]

然后你想在每个元素上应用昂贵的函数，并根据它进行过滤。 你做的是：

result = [
    (x, expensive)
    for x in data
    for expensive in [expensive_function(x)] #alias
    if expensive > 3
]

print(result)

第二个for只会遍历大小为1的列表，有效地使其成为别名。 输出将显示昂贵的函数被调用12次，每个数据元素只调用一次。 然而，函数的结果（最多）使用两次，一次用于滤波器，一次用于输出。

请始终确保使用像我这样的多行来布局这样的理解，并将#alias附加到别名所在的行。 如果你使用别名，那么理解就会变得非常复杂，你应该帮助未来的代码读者获得你正在做的事情。 这不是perl，你知道;）。

为了完整性，输出：

called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
called the very expensive function, that will be $2
[(4, 20), (7, 56), (3, 12), (7, 56), (2, 6), (3, 12), (4, 20), (7, 56), (3, 12)]

代码： http ： //ideone.com/7mUQUt

Answer 2

关于＃1，是的，它们将被多次评估。

关于＃2，这样做的方法是计算和过滤单独的理解：

简明版：

[(x,fx,gx) for (x,fx,gx) in ((x,fx,g(fx)) for (x,fx) in ((x,f(x)) for x in bigList) if fx < p) if gx<q]

更长的版本扩展到更容易遵循：

[(x,f,g) for (x,f,g) in
  ((x,f,g(f)) for (x,f) in
     ((x,f(x)) for x in bigList)
  if f < p)
if g<q]

这将尽可能少地调用f和g （每个f(x)值不是< p将永远不会调用g ，并且f将仅对bigList每个值调用一次）。

如果您愿意，还可以使用中间变量获得更整洁的代码：

a = ( (x,f(x)) for x in bigList )
b = ( (x,fx,g(fx)) for (x,fx) in a if fx<p )
results = [ c for c in b if c[2] < q ] # faster than writing out full tuples

a和b使用生成器表达式，这样它们就不必实际实例化列表，只需在必要时进行评估。

Answer 3

随着列表理解变得更加复杂，它们也开始变得非常难以阅读。 在这种情况下，通常最好将其内部转换为生成器函数，并为它们提供（希望）有意义的名称。

# First example
def getNearbyPoints(x, radius, points):
    """Yields points where 'delta(x, point) <= radius'"""
    for p in points:
        distance = delta(p, x)
        if distance <= radius:
            yield p, distance

nearbyPoints = list(getNearbyPoints(x, radius, allPoints))


# Second example
def xfg(data, p, q):
    """Yield 3-tuples of x, f(x), g(f(x))"""
    for x in data:
        f = f(x)
        if f < p:
            g = g(f)
            if g < q:
                yield x, f, g

newList = list(xfg(bigList, p, q))

Answer 4

如果在表达式中调用两次函数（包括在列表推导中），它实际上将被调用两次。 Python无法知道您的函数是纯函数还是程序函数。 它告诉它，在这种情况下，它会两次调用它。
没有办法在列表推导中分配变量，因为在Python中，赋值是一个语句，而不是表达式。

听起来你应该使用完整的循环，而不是列表理解。

我可以在Python列表推导中使用别名来防止它们被多次评估吗？

问题描述

4 个解决方案

解决方案1
12 2015-08-19 10:45:05

解决方案2
10 已采纳 2011-01-30 00:41:24

解决方案3
4 2011-02-10 05:46:32

解决方案4
3 2011-01-30 00:41:31

我可以在Python列表推导中使用别名来防止它们被多次评估吗？

问题描述

4 个解决方案

解决方案1 12 2015-08-19 10:45:05

解决方案2 10 已采纳 2011-01-30 00:41:24

解决方案3 4 2011-02-10 05:46:32

解决方案4 3 2011-01-30 00:41:31

解决方案1
12 2015-08-19 10:45:05

解决方案2
10 已采纳 2011-01-30 00:41:24

解决方案3
4 2011-02-10 05:46:32

解决方案4
3 2011-01-30 00:41:31