從列表中刪除 NOT 重復值

Question

場景是這樣的：

使用以下方法加入多個列表后：

list1 = ["A","B"]
list2 = ["A","B","C"]
list3 = ["C","D","E"]

mainlist = list1 + list2 + list3
mainlist.sort()

主列表現在看起來像這樣：

mainlist = ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'E']

我想刪除任何不是重復值的東西。 如果有問題的值已經存在於列表中，則不得觸摸它，而如果它僅在主列表中出現一次，我想將其刪除。

我嘗試使用這種方法，但似乎有些東西不起作用：

for i in mainlist:
    if mainlist.count(i) <= 1:
        mainlist.remove(i)
    else:
        continue

但我返回的是一個如下所示的列表：

mainlist = ['A', 'A', 'B', 'B', 'C', 'C', 'E'] #value "D" is not anymore present. Why?

我想返回的是這樣的列表：

mainlist = ['A', 'A', 'B', 'B', 'C', 'C'] #All values NOT duplicates have been deleted

我可以使用以下代碼刪除重復項：

for i in mainlist:
    if mainlist.count(i) > 1:
        mainlist.remove(i)
    else:
        continue

然后作為最終結果：

mainlist = ['A','B','C']

但真正的問題是：如何刪除列表中的非重復項？

Answer 1

您可以找到這樣的重復項：

duplicates = [item for item in mainlist if mainlist.count(item) > 1]

Answer 2

您可以使用collections.Counter()來跟蹤每個項目的頻率：

from collections import Counter

counts = Counter(mainlist)
[item for item in mainlist if counts[item] > 1]

這輸出：

['A', 'A', 'B', 'B', 'C', 'C']

Answer 3

使用collections.Counter對列表元素進行計數。 使用列表推導僅保留多次出現的元素。 請注意，列表不必排序。

from collections import Counter
list1 = ["A","B"]
list2 = ["A","B","C"]
list3 = ["C","D","E"]
mainlist = list1 + list2 + list3

cnt = Counter(mainlist)
print(cnt)
# Counter({'A': 2, 'B': 2, 'C': 2, 'D': 1, 'E': 1})

dups = [x for x in mainlist if cnt[x] > 1]
print(dups)
# ['A', 'B', 'A', 'B', 'C', 'C']

Answer 4

另一種解決方案，使用numpy ：

u, c = np.unique(mainlist, return_counts=True)
out = np.repeat(u[c > 1], c[c > 1])
print(out)

印刷：

['A' 'A' 'B' 'B' 'C' 'C']

Answer 5

您的問題在於您在對其進行迭代時進行操作。 刪除"D"后，循環停止，因為列表中沒有更多元素作為索引 6 處的"E" 。

創建列表的副本並僅對該列表進行操作：

new_list = list(mainlist)
for i in mainlist:
    if mainlist.count(i) <= 1:
        new_list.remove(i)
    else:
        continue

Answer 6

如果您只想輸出列表中重復元素的列表，您可以使用集合和推導來僅保留重復項。

list1 = ["A","B"]
list2 = ["A","B","C"]
list3 = ["C","D","E"]

fulllist = list1 + list2 + list3
fullset = set(list1) | set(list2) | set(list3)

dups = [x for x in fullset if fulllist.count(x) > 1]

print(dups)  # ['A', 'C', 'B']

從列表中刪除 NOT 重復值

問題描述

6 個解決方案

解決方案1
4 2022-05-18 19:56:45

解決方案2
2 2022-05-18 19:39:41

解決方案3
2 2022-05-18 19:42:09

解決方案4
2 2022-05-18 21:07:48

解決方案5
1 已采納 2022-05-18 19:45:48

解決方案6
1 2022-05-18 19:48:26

從列表中刪除 NOT 重復值

問題描述

6 個解決方案

解決方案1 4 2022-05-18 19:56:45

解決方案2 2 2022-05-18 19:39:41

解決方案3 2 2022-05-18 19:42:09

解決方案4 2 2022-05-18 21:07:48

解決方案5 1 已采納 2022-05-18 19:45:48

解決方案6 1 2022-05-18 19:48:26

解決方案1
4 2022-05-18 19:56:45

解決方案2
2 2022-05-18 19:39:41

解決方案3
2 2022-05-18 19:42:09

解決方案4
2 2022-05-18 21:07:48

解決方案5
1 已采納 2022-05-18 19:45:48

解決方案6
1 2022-05-18 19:48:26