如何在列表中刪除這些重復項（Python）

Question

biglist = 

[ 

    {'title':'U2 Band','link':'u2.com'}, 
    {'title':'ABC Station','link':'abc.com'}, 
    {'title':'Live Concert by U2','link':'u2.com'} 

]

我想刪除列表中的THIRD元素...因為它具有重復的“ u2.com”。 我不想重復的“鏈接”元素。 這樣做最有效的代碼是什么：

biglist = 

[ 

    {'title':'U2','link':'u2.com'}, 
    {'title':'ABC','link':'abc.com'}
]

我嘗試了許多方法，包括使用許多嵌套的“ for ... in ....”，但這效率很低而且太長。

Answer 1

對於一個很大的列表，如果您想保留剩余項目的確切順序，可能是最快的方法如下：

biglist = [ 
    {'title':'U2 Band','link':'u2.com'}, 
    {'title':'ABC Station','link':'abc.com'}, 
    {'title':'Live Concert by U2','link':'u2.com'} 
]

known_links = set()
newlist = []

for d in biglist:
  link = d['link']
  if link in known_links: continue
  newlist.append(d)
  known_links.add(link)

biglist[:] = newlist

Answer 2

制作一個新字典，用'u2.com'和'abc.com'作為鍵，並使用列表元素作為值。 字典將強制唯一性。 像這樣：

uniquelist = dict((element['link'], element) for element in reversed(biglist))

（存在相反的內容，因此列表中的第一個元素將是保留在字典中的元素。如果將其刪除，則將獲得最后一個元素）。

然后，您可以將元素重新放入這樣的列表中：

biglist = uniquelist.values()

Answer 3

您可以使用每個字典的link字段作為排序關鍵字對列表進行排序，然后遍歷列表一次並刪除重復項（或者，如Python習慣用法一樣，創建一個刪除重復項的新列表），如下所示：

# sort the list using the 'link' item as the sort key
biglist.sort(key=lambda elt: elt['link'])

newbiglist = []
for item in biglist:
    if newbiglist == [] or item['link'] != newbiglist[-1]['link']:
        newbiglist.append(item)

這段代碼將為您提供任何“重復項”組的第一個元素（原始biglist中的相對順序）。 之所以如此，是因為Python使用的.sort()算法保證是穩定的排序-它不會更改確定為彼此相等的元素的順序（在這種情況下，元素具有相同的link ）。

Answer 4

biglist = \
[ 
    {'title':'U2 Band','link':'u2.com'}, 
    {'title':'ABC Station','link':'abc.com'}, 
    {'title':'Live Concert by U2','link':'u2.com'} 
]

def dedupe(lst):
    d = {}
    for x in lst:
        link = x["link"]
        if link in d:
            continue
        d[link] = x
    return d.values()

lst = dedupe(biglist)

dedupe（）保留所有重復項中的第一個。

Answer 5

您可以使用defaultdict按link對項目進行分組，然后根據需要刪除重復項。

from collections import defaultdict

nodupes = defaultdict(list)
for d in biglist:
    nodupes[d['url']].append(d['title']

這將為您提供：

defaultdict(<type 'list'>, {'abc.com': ['ABC Station'], 'u2.com': ['U2 Band', 
'Live Concert by U2']})

如何在列表中刪除這些重復項（Python）

問題描述

5 個解決方案

解決方案1
8 2009-10-08 02:08:34

解決方案2
3 2009-10-07 23:21:24

解決方案3
2 已采納 2009-10-07 23:21:53

解決方案4
1 2009-10-07 23:32:42

解決方案5
0 2009-10-08 02:22:41

如何在列表中刪除這些重復項（Python）

問題描述

5 個解決方案

解決方案1 8 2009-10-08 02:08:34

解決方案2 3 2009-10-07 23:21:24

解決方案3 2 已采納 2009-10-07 23:21:53

解決方案4 1 2009-10-07 23:32:42

解決方案5 0 2009-10-08 02:22:41

解決方案1
8 2009-10-08 02:08:34

解決方案2
3 2009-10-07 23:21:24

解決方案3
2 已采納 2009-10-07 23:21:53

解決方案4
1 2009-10-07 23:32:42

解決方案5
0 2009-10-08 02:22:41