[英]filtering a list of tuples in python
我正在寻找一种干净的pythonic方法来执行以下操作
我有一个元组列表说:
[(1,'a'), (1,'b'), (1,'c'), (2, 'd'), (5, 'e'), (5, 'f')]
我想创建一个新列表,该列表将丢弃之前已经看到过第一个键的元组。 因此,上述的o / p为:
[(1,'c'), (2,'d'), (5, 'f')]
谢谢!
一种简单的方法是创建一个字典,因为它将只保留最后一个具有相同键的元素:
In [1]: l = [(1,'a'), (1,'b'), (1,'c'), (2, 'd'), (5, 'e'), (5, 'f')]
In [2]: dict(l).items()
Out[2]: [(1, 'c'), (2, 'd'), (5, 'f')]
更新:正如@Tadeck在其评论中提到的那样,由于不能保证字典项目的顺序,因此您可能要使用有序字典 :
from collections import OrderedDict
newl = OrderedDict(l).items()
如果您实际上想使用相同的键来保留第一个元组(而不是最后一个,则您的问题是模棱两可的),则可以首先反转列表,将其添加到字典中,然后再次反转.items()
的输出。
尽管在这种情况下,可能有更好的方法可以完成此操作。
使用unique_everseen
从itertools
文档
from itertools import ifilterfalse
def unique_everseen(iterable, key=None):
"List unique elements, preserving order. Remember all elements ever seen."
# unique_everseen('AAAABBBCCDAABBB') --> A B C D
# unique_everseen('ABBCcAD', str.lower) --> A B C D
seen = set()
seen_add = seen.add
if key is None:
for element in ifilterfalse(seen.__contains__, iterable):
seen_add(element)
yield element
else:
for element in iterable:
k = key(element)
if k not in seen:
seen_add(k)
yield element
a = [(1,'a'), (1,'b'), (1,'c'), (2, 'd'), (5, 'e'), (5, 'f')]
print list(unique_everseen(a,key=lambda x: x[0]))
屈服
[(1, 'a'), (2, 'd'), (5, 'e')]
一位班轮专科医生的巧妙技巧,可以使顺序保持正确(我承认它不是很可读,但是您知道...)
>>> s = [(1,'a'), (1,'b'), (1,'c'), (2, 'd'), (5, 'e'), (5, 'f')]
>>> seen = set()
>>> [seen.add(x[0]) or x for x in s if x[0] not in seen]
[(1, 'a'), (2, 'd'), (5, 'e')]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.