繁体   English   中英

合并两个列表并删除重复项,而不删除原始列表中的重复项

[英]Combining two lists and removing duplicates, without removing duplicates in original list

我有两个列表需要合并,其中第二个列表忽略了第一个列表的任何重复项。 .. 有点难以解释,所以让我展示一个代码的例子,以及我想要的结果。

first_list = [1, 2, 2, 5]

second_list = [2, 5, 7, 9]

# The result of combining the two lists should result in this list:
resulting_list = [1, 2, 2, 5, 7, 9]

您会注意到结果有第一个列表,包括它的两个“2”值,但事实上 second_list 还有一个额外的 2 和 5 值并没有添加到第一个列表中。

通常对于这样的事情我会使用集合,但是 first_list 上的集合会清除它已经拥有的重复值。 所以我只是想知道实现这种所需组合的最佳/最快方法是什么。

谢谢。

您需要将第二个列表中不在第一个列表中的元素附加到第一个列表中 - 集合是确定它们是哪些元素的最简单方法,如下所示:

first_list = [1, 2, 2, 5]
second_list = [2, 5, 7, 9]

in_first = set(first_list)
in_second = set(second_list)

in_second_but_not_in_first = in_second - in_first

result = first_list + list(in_second_but_not_in_first)
print(result)  # Prints [1, 2, 2, 5, 9, 7]

或者,如果您更喜欢单衬 8-)

print(first_list + list(set(second_list) - set(first_list)))
resulting_list = list(first_list)
resulting_list.extend(x for x in second_list if x not in resulting_list)

您可以使用集合:

first_list = [1, 2, 2, 5]
second_list = [2, 5, 7, 9]

resultList= list(set(first_list) | set(second_list))

print(resultList)
# Results in : resultList = [1,2,5,7,9]
first_list = [1, 2, 2, 5]
second_list = [2, 5, 7, 9]

print( set( first_list + second_list ) )

如果您使用 numpy,您可以将其简化为一行代码:

a = [1,2,3,4,5,6,7]
b = [2,4,7,8,9,10,11,12]

sorted(np.unique(a+b))

>>> [1,2,3,4,5,6,7,8,9,10,11,12]

对我来说最简单的是:

first_list = [1, 2, 2, 5]
second_list = [2, 5, 7, 9]

merged_list = list(set(first_list+second_list))
print(merged_list)

#prints [1, 2, 5, 7, 9]
resulting_list = first_list + [i for i in second_list if i not in first_list]

您还可以将 RichieHindle 和 Ned Batchelder 的响应结合起来,以获得保留顺序的平均情况O(m+n)算法:

first_list = [1, 2, 2, 5]
second_list = [2, 5, 7, 9]

fs = set(first_list)
resulting_list = first_list + [x for x in second_list if x not in fs]

assert(resulting_list == [1, 2, 2, 5, 7, 9])

请注意, x in s中的x in s的最坏情况复杂度为O(m) ,因此此代码的最坏情况复杂度仍为O(m*n)

基于配方

result_list = list(set().union(first_list, second_list))

您可以使用dict.fromkeys返回没有重复的列表:

def mergeTwoListNoDuplicates(list1, list2):
    """
    Merges two lists together without duplicates
    :param list1:
    :param list2:
    :return:
    """
    merged_list = list1 + list2
    merged_list = list(dict.fromkeys(merged_list))
    return merged_list

这可能有帮助

def union(a,b):
    for e in b:
        if e not in a:
            a.append(e)

union 函数将第二个列表合并到第一个列表中,如果它已经在 a 中,则不复制 a 的元素。 类似于设置联合运算符。 该功能不变 b. 如果 a=[1,2,3] b=[2,3,4]。 在 union(a,b) 使 a=[1,2,3,4] 和 b=[2,3,4] 之后

L1 = [1,2,3,3,4,4]
L2 = [3,4,5,6,6,6]
L1.extend(L2)
L3 =[]
[L3.append(num) for num in L1 if num not in L3]
print L3
[1, 2, 3, 4, 5, 6]
[Finished in 0.5s]

就像belove一样:

resulting_list = list(set(resulting_list))

list1 = [1, 2, 1]
list2 = [2, 3, 4, 3]

def extendList(list1, list2):
   return list(set(list1+list2))

list12 = extendList(list1, list2)
print(list12)

输出:[1,2,3,4]

    first_list = [1, 2, 2, 5]
    second_list = [2, 5, 7, 9]

    newList=[]
    for i in first_list:
        newList.append(i)
    for z in second_list:
        if z not in newList:
            newList.append(z)
    newList.sort()
    print newList

[1, 2, 2, 5, 7, 9]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM