繁体   English   中英

提取每个子列表的第一项

[英]Extract first item of each sublist

我想知道在列表列表中提取每个子列表的第一项并将其附加到新列表的最佳方法是什么。 所以如果我有:

lst = [[a,b,c], [1,2,3], [x,y,z]]

我想取出a1x并从中创建一个单独的列表。

我试过了:

lst2.append(x[0] for x in lst)

使用列表理解

>>> lst = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [item[0] for item in lst]
>>> lst2
['a', 1, 'x']

您可以使用 zip:

>>> lst=[[1,2,3],[11,12,13],[21,22,23]]
>>> zip(*lst)[0]
(1, 11, 21)

或者,Python 3 中zip不生成列表:

>>> list(zip(*lst))[0]
(1, 11, 21)

或者,

>>> next(zip(*lst))
(1, 11, 21)

或者,(我最喜欢的)使用 numpy:

>>> import numpy as np
>>> a=np.array([[1,2,3],[11,12,13],[21,22,23]])
>>> a
array([[ 1,  2,  3],
       [11, 12, 13],
       [21, 22, 23]])
>>> a[:,0]
array([ 1, 11, 21])

有同样的问题,并对每个解决方案的性能感到好奇。

这是%timeit

import numpy as np
lst = [['a','b','c'], [1,2,3], ['x','y','z']]

第一种 numpy 方式,转换数组:

%timeit list(np.array(lst).T[0])
4.9 µs ± 163 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

使用列表理解完全原生(如@alecxe 所解释):

%timeit [item[0] for item in lst]
379 ns ± 23.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

使用zip的另一种本地方式(如@dawg 所述):

%timeit list(zip(*lst))[0]
585 ns ± 7.26 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

第二个numpy方式。 @dawg 也解释了:

%timeit list(np.array(lst)[:,0])
4.95 µs ± 179 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

令人惊讶的是(好吧,至少对我来说)使用列表理解的本地方式是最快的,比 numpy 方式快 10 倍。 在没有最终list的情况下运行两种 numpy 方式可以节省大约 1 µs,但仍然相差 10 倍。

请注意,当我用对len的调用包围每个代码片段时,以确保生成器运行到最后,时间保持不变。

Python 包含一个名为 itemgetter 的函数,用于返回列表中特定索引处的项目:

from operator import itemgetter

将要检索的项目的索引传递给 itemgetter() 函数。 要检索第一项,您将使用 itemgetter(0)。 要理解的重要一点是 itemgetter(0) 本身返回一个函数。 如果您将列表传递给该函数,您将获得特定项目:

itemgetter(0)([10, 20, 30]) # Returns 10

当您将它与 map() 结合使用时,这很有用,map() 将一个函数作为其第一个参数,并将一个列表(或任何其他可迭代)作为第二个参数。 它返回对迭代中的每个对象调用函数的结果:

my_list = [['a', 'b', 'c'], [1, 2, 3], ['x', 'y', 'z']]
list(map(itemgetter(0), my_list)) # Returns ['a', 1, 'x']

请注意,map() 返回一个生成器,因此将结果传递给 list() 以获取实际列表。 总之,您的任务可以这样完成:

lst2.append(list(map(itemgetter(0), lst)))

这是使用列表推导的另一种方法,选择哪种方法在很大程度上取决于上下文、可读性和偏好。

更多信息: https ://docs.python.org/3/library/operator.html#operator.itemgetter

您的代码几乎是正确的。 唯一的问题是列表理解的使用。

如果你使用 like: (x[0] for x in lst),它会返回一个生成器对象。 如果你使用 like: [x[0] for x in lst],它会返回一个列表。

当您将列表推导输出附加到列表时,列表推导的输出是列表的单个元素。

lst = [["a","b","c"], [1,2,3], ["x","y","z"]]
lst2 = []
lst2.append([x[0] for x in lst])
print lst2[0]

lst2 = [['a', 1, 'x']]

lst2[0] = ['a', 1, 'x']

如果我不正确,请告诉我。

lst = [['a','b','c'], [1,2,3], ['x','y','z']]
outputlist = []
for values in lst:
    outputlist.append(values[0])

print(outputlist) 

输出: ['a', 1, 'x']

你说你有一个现有的清单。 所以我会同意的。

>>> lst1 = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [1, 2, 3]

现在,您正在将生成器对象附加到您的第二个列表中。

>>> lst2.append(item[0] for item in lst)
>>> lst2
[1, 2, 3, <generator object <genexpr> at 0xb74b3554>]

但您可能希望它是第一个项目的列表

>>> lst2.append([item[0] for item in lst])
>>> lst2
[1, 2, 3, ['a', 1, 'x']]

现在我们将第一个项目的列表附加到现有列表中。 如果您想将项目本身而不是它们的列表添加到现有项目中,则可以使用 list.extend。 在这种情况下,我们不必担心添加生成器,因为 extend 将使用该生成器添加从那里获取的每个项目,以扩展当前列表。

>>> lst2.extend(item[0] for item in lst)
>>> lst2
[1, 2, 3, 'a', 1, 'x']

或者

>>> lst2 + [x[0] for x in lst]
[1, 2, 3, 'a', 1, 'x']
>>> lst2
[1, 2, 3]

https://docs.python.org/3.4/tutorial/datastructures.html#more-on-lists https://docs.python.org/3.4/tutorial/datastructures.html#list-comprehensions

我可以建议的另一个答案是

lst = [['a','b','c'], [1,2,3], ['x','y','z']]
new_lst=[lst[0][0],lst[1][0],lst[2][0]]
print(new_lst)

输出如下

['a', 1, 'x']

希望这可以帮助! 谢谢!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM