如何限制 Python 中循环的迭代？

Question

假设我有一个项目列表，我想迭代其中的前几个：

items = list(range(10)) # I mean this to represent any kind of iterable.
limit = 5

幼稚的实现

来自其他语言的 Python naïf 可能会编写这个非常有用和高性能（如果单语）的代码：

index = 0
for item in items: # Python's `for` loop is a for-each.
    print(item)    # or whatever function of that item.
    index += 1
    if index == limit:
        break

更惯用的实现

但是 Python 有 enumerate，它很好地包含了大约一半的代码：

for index, item in enumerate(items):
    print(item)
    if index == limit: # There's gotta be a better way.
        break

所以我们将额外的代码减半。 但一定有更好的方法。

我们可以近似下面的伪代码行为吗？

如果 enumerate 采用另一个可选的stop参数（例如，它采用这样的start参数： enumerate(items, start=1) ），我认为这是理想的，但以下不存在（请参阅enumerate 上的文档在这里）：

# hypothetical code, not implemented:
for _, item in enumerate(items, start=0, stop=limit): # `stop` not implemented
    print(item)

请注意，不需要命名index因为不需要引用它。

有没有一种惯用的方式来写上面的内容？ 怎么样？

第二个问题：为什么这不内置在枚举中？

Answer 1

如何限制 Python 中循环的迭代？
 for index, item in enumerate(items): print(item) if index == limit: break
有没有更短的、惯用的方式来写上面的内容？ 怎么样？

包括索引

zip在其参数中最短的可迭代对象上停止。 （与zip_longest的行为zip_longest ，后者使用最长的可迭代对象。）

range可以提供一个有限的迭代器，我们可以将它与我们的主要迭代器一起传递给 zip。

所以我们可以将一个range对象（带有它的stop参数）传递给zip并像有限枚举一样使用它。

`zip(range(limit), items)`

使用 Python 3， zip和range返回可迭代对象，它们对数据进行管道传输，而不是在中间步骤的列表中具体化数据。

for index, item in zip(range(limit), items):
    print(index, item)

要在 Python 2 中获得相同的行为，只需将xrange替换为range并将itertools.izip替换为zip 。

from itertools import izip
for index, item in izip(xrange(limit), items):
    print(item)

如果不需要索引， `itertools.islice`

您可以使用itertools.islice ：

for item in itertools.islice(items, 0, stop):
    print(item)

这不需要分配给索引。

组合`enumerate(islice(items, stop))`以获取索引

正如 Pablo Ruiz Ruiz 所指出的，我们也可以用 enumerate 组合 islice。

for index, item in enumerate(islice(items, limit)):
    print(index, item)

为什么这不内置在enumerate ？

这是在纯 Python 中实现的枚举（可能进行修改以在注释中获得所需的行为）：

def enumerate(collection, start=0):  # could add stop=None
    i = start
    it = iter(collection)
    while 1:                         # could modify to `while i != stop:`
        yield (i, next(it))
        i += 1

对于那些已经使用 enumerate 的人来说，上面的性能会降低，因为它必须检查是否是时候停止每次迭代了。 如果没有停止参数，我们可以检查并使用旧的枚举：

_enumerate = enumerate

def enumerate(collection, start=0, stop=None):
    if stop is not None:
        return zip(range(start, stop), collection)
    return _enumerate(collection, start)

这种额外的检查对性能的影响可以忽略不计。

至于为什么enumerate 没有停止参数，这是最初提出的（参见PEP 279 ）：

这个函数最初是用可选的开始和停止参数提出的。 GvR [Guido van Rossum] 指出函数调用enumerate(seqn, 4, 6)有一个替代的、合理的解释，作为一个切片，将返回序列的第四和第五个元素。 为了避免歧义，可选参数被删除，即使这意味着失去作为循环计数器的灵活性。 这种灵活性对于从一开始计数的常见情况最为重要，例如：
 for linenum, line in enumerate(source,1): print linenum, line

所以显然start被保留是因为它非常有价值，而stop被删除是因为它的用例较少并且导致了对新函数使用的混淆。

避免使用下标符号进行切片

另一个答案说：

为什么不简单地使用
for item in items[:limit]: # or limit+1, depends

这里有一些缺点：

它只适用于接受切片的迭代，因此它更受限制。
如果它们确实接受切片，它通常会在内存中创建一个新的数据结构，而不是遍历引用数据结构，因此会浪费内存（所有内置对象在切片时都会进行复制，但是，例如，numpy 数组在切片时会生成视图）。
不可切片的可迭代对象需要其他类型的处理。 如果您切换到惰性求值模型，则还必须使用切片来更改代码。

当您了解限制以及它是制作副本还是视图时，您应该只使用带有下标符号的切片。

结论

我认为现在 Python 社区知道 enumerate 的用法，混淆成本将被参数的价值所抵消。

在此之前，您可以使用：

for index, element in zip(range(limit), items):
    ...

或

for index, item in enumerate(islice(items, limit)):
    ...

或者，如果您根本不需要索引：

for element in islice(items, 0, limit):
    ...

并避免使用下标符号进行切片，除非您了解这些限制。

Answer 2

您可以为此使用itertools.islice 。 它接受start 、 stop和step参数，如果您只传递一个参数，则将其视为stop 。 它适用于任何可迭代对象。

itertools.islice(iterable, stop)
itertools.islice(iterable, start, stop[, step])

演示：

>>> from itertools import islice
>>> items = list(range(10))
>>> limit = 5
>>> for item in islice(items, limit):
    print item,
...
0 1 2 3 4

来自文档的示例：

islice('ABCDEFG', 2) --> A B
islice('ABCDEFG', 2, 4) --> C D
islice('ABCDEFG', 2, None) --> C D E F G
islice('ABCDEFG', 0, None, 2) --> A C E G

Answer 3

为什么不简单地使用

for item in items[:limit]: # or limit+1, depends
    print(item)    # or whatever function of that item.

这仅适用于某些可迭代对象，但由于您指定了列表，因此它有效。

如果您使用 Sets 或 dicts 等，则它不起作用。

Answer 4

使用枚举内的限制通过 islice

a = [2,3,4,2,1,4]

for a, v in enumerate(islice(a, 3)): 
   print(a, v)

输出：

0 2
1 3
2 4

Answer 5

为什么不循环直到限制或列表末尾，以较早发生者为准，如下所示：

items = range(10)
limit = 5
for i in range(min(limit, len(items))):
  print items[i]

输出：

Answer 6

简短的解决方案

items = range(10)
limit = 5

for i in items[:limit]: print(i)

如何限制 Python 中循环的迭代？

问题描述

幼稚的实现

更惯用的实现

我们可以近似下面的伪代码行为吗？

6 个解决方案

解决方案1
106 已采纳 2016-03-19 20:22:48

如何限制 Python 中循环的迭代？

包括索引

`zip(range(limit), items)`

如果不需要索引， `itertools.islice`

组合`enumerate(islice(items, stop))`以获取索引

为什么这不内置在`enumerate` ？

避免使用下标符号进行切片

结论

解决方案2
29 2016-03-19 20:41:10

解决方案3
25 2016-03-19 20:28:00

解决方案4
1 2018-08-17 16:11:20

解决方案5
1 2018-09-26 20:07:15

解决方案6
-2 2020-02-22 09:56:59

如何限制 Python 中循环的迭代？

问题描述

幼稚的实现

更惯用的实现

我们可以近似下面的伪代码行为吗？

6 个解决方案

解决方案1 106 已采纳 2016-03-19 20:22:48

如何限制 Python 中循环的迭代？

包括索引

zip(range(limit), items)

如果不需要索引， itertools.islice

组合enumerate(islice(items, stop))以获取索引

为什么这不内置在enumerate ？

避免使用下标符号进行切片

结论

解决方案2 29 2016-03-19 20:41:10

解决方案3 25 2016-03-19 20:28:00

解决方案4 1 2018-08-17 16:11:20

解决方案5 1 2018-09-26 20:07:15

解决方案6 -2 2020-02-22 09:56:59

解决方案1
106 已采纳 2016-03-19 20:22:48

`zip(range(limit), items)`

如果不需要索引， `itertools.islice`

组合`enumerate(islice(items, stop))`以获取索引

为什么这不内置在`enumerate` ？

解决方案2
29 2016-03-19 20:41:10

解决方案3
25 2016-03-19 20:28:00

解决方案4
1 2018-08-17 16:11:20

解决方案5
1 2018-09-26 20:07:15

解决方案6
-2 2020-02-22 09:56:59