使元組列表中的元素在 python 中唯一的有效方法是什么？

Question

假設我有一個元組列表

l = [('A', 12345), ('A', 2435), ('A', 2342), ('B', 2968), ('B', 9483), ('C', 563)]

使我的列表中的項目獨一無二的最有效方法是什么，如下所示：

l = [('A.1', 12345), ('A.2', 2435), ('A.3', 2342), ('B.1', 2968), ('B.2', 9483), ('C.1', 563)]

Answer 1

一種方法可能是使用itertools.groupby()分組，然后“擴展”這些組：

from itertools import groupby
from operator import itemgetter

l = [('A', 12345), ('A', 2435), ('A', 2342), ('B', 2968), ('B', 9483), ('C', 563)]


print([
    (f'{k}.{index}', v) 
    for k, g in groupby(l, itemgetter(0)) 
    for index, (_, v) in enumerate(g, start=1)
])

印刷：

[('A.1', 12345), ('A.2', 2435), ('A.3', 2342), ('B.1', 2968), ('B.2', 9483), ('C.1', 563)]

請注意，要使分組起作用，輸入l需要按分組鍵進行排序，本示例輸入似乎就是這種情況。

Answer 2

根據要求，我發布了一個熊貓方法來解決這個問題：

import pandas as pd
df =  pd.DataFrame(l)

# Create a count per group and add them to the string:
df[0] = df[0] + "." + list(map(str,list(df.groupby(0).cumcount()+1)))

# Transpose the columns to rows so we can aggregate by 2 and create a tuple:
df.T.groupby(np.arange(len(df.T))//2).agg(tuple).to_numpy().tolist()[0]

輸出

[('A.1', 12345),
 ('A.2', 2435),
 ('A.3', 2342),
 ('B.1', 2968),
 ('B.2', 9483),
 ('C.1', 563)]

Answer 3

您還可以使用collections.defaultdict()分組，然后使用itertools.chain.from_iterable()將結果展平。 無論結果是否排序，這都有效。

from collections import defaultdict

from itertools import chain

l = [("A", 12345), ("A", 2435), ("A", 2342), ("B", 2968), ("B", 9483), ("C", 563)]

# First group by first item in tuple
groups = defaultdict(list)
for k, v in l:
    groups[k].append(v)
# defaultdict(<class 'list'>, {'A': [12345, 2435, 2342], 'B': [2968, 9483], 'C': [563]})

# Now flatten grouped items into a flat list
result = list(
    chain.from_iterable(
        (("%s.%d" % (k, i), e) for i, e in enumerate(v, start=1))
        for k, v in groups.items()
    )
)

print(result)

輸出：

[('A.1', 12345), ('A.2', 2435), ('A.3', 2342), ('B.1', 2968), ('B.2', 9483), ('C.1', 563)]

使元組列表中的元素在 python 中唯一的有效方法是什么？

問題描述

3 個解決方案

解決方案1
4 2019-12-09 22:58:47

解決方案2
3 2019-12-09 23:12:51

解決方案3
2 已采納 2019-12-09 23:50:25

使元組列表中的元素在 python 中唯一的有效方法是什么？

問題描述

3 個解決方案

解決方案1 4 2019-12-09 22:58:47

解決方案2 3 2019-12-09 23:12:51

解決方案3 2 已采納 2019-12-09 23:50:25

解決方案1
4 2019-12-09 22:58:47

解決方案2
3 2019-12-09 23:12:51

解決方案3
2 已采納 2019-12-09 23:50:25