如何按 Python 中的第一个元素重新分类元组列表？

Question

使用 Python3.x，我有一个元组列表如下（其中第一个元素是整数或字符串）：

tuple_list = [(1, 'AA', 515), (1, 'BBT', 101), 
                  (1, 'CZF', 20), (2, 'TYZ', 8341), (2, 'ONR', 11)]

在此示例中，一些元组以1开头，其他元组以2开头。 每个都被放入一个单独的列表中。

我想要一种方法将具有相同第一个元素的元组“分类”到单独的列表中。

在这种情况下，所需的解决方案如下，一个列表列表：

[[(1, 'AA', 515), (1, 'BBT', 101), (1, 'CZF', 20)], 
        [(2, 'TYZ', 8341), (2, 'ONR', 11)]]

这可以通过迭代和检查每个（唯一的）第一个元素的列表是否存在来实现，但是对于具有更多“唯一”第一个元素而不是简单的1和2更大列表，这在计算上会很昂贵。

如何做到这一点才能快速/高效？

Answer 1

使用itertools.groupby 。 与operator.itemgetter配对以实现高效查找/切片。

from itertools import groupby
from operator import itemgetter

tuple_list = [(1, 'AA', 515), (1, 'BBT', 101), (1, 'CZF', 20), (2, 'TYZ', 8341), (2, 'ONR', 11)]

get_first = itemgetter(0)
result = [list(g) for k, g in groupby(sorted(tuple_list, key=get_first), get_first)]

结果：

[[(1, 'AA', 515), (1, 'BBT', 101), (1, 'CZF', 20)], [(2, 'TYZ', 8341), (2, 'ONR', 11)]]

或者使用collections.defaultdict

from collections import defaultdict

d = defaultdict(list)

for t in tuple_list:
    d[t[0]].append(t)

result = list(d.values())

结果：

[[(1, 'AA', 515), (1, 'BBT', 101), (1, 'CZF', 20)], [(2, 'TYZ', 8341), (2, 'ONR', 11)]]

Answer 2

一种方法是使用defaultdict并将第一个元素存储为索引，然后将它们分组，如下所示：

from collections import defaultdict

tuple_list = [(1, 'AA', 515), (1, 'BBT', 101),
                  (1, 'CZF', 20), (2, 'TYZ', 8341), (2, 'ONR', 11)]

dct = defaultdict(list)
for l in tuple_list:
    dct[l[0]].append(l)

print(sorted(dct.values(), key=lambda l: l[0][0]))

>>> [[(1, 'AA', 515), (1, 'BBT', 101), (1, 'CZF', 20)], [(2, 'TYZ', 8341), (2, 'ONR', 11)]]

如何按 Python 中的第一个元素重新分类元组列表？

问题描述

2 个解决方案

解决方案1
3 已采纳 2020-02-20 18:34:31

解决方案2
1 2020-02-20 18:42:01

如何按 Python 中的第一个元素重新分类元组列表？

问题描述

2 个解决方案

解决方案1 3 已采纳 2020-02-20 18:34:31

解决方案2 1 2020-02-20 18:42:01

解决方案1
3 已采纳 2020-02-20 18:34:31

解决方案2
1 2020-02-20 18:42:01