[英]Most efficient way to compute differences and intersection of two sets in Python
假设我们有两组s1
和s2
。
我需要基于这两个集合的三个不同的集合:
s1
但不存在于s2
中的元素集。s2
但不存在于s1
中的元素集。s1
和s2
中都存在的一组元素。这些可以很容易地计算如下:
s1 = {1, 2, 3, 4, 5}
s2 = {3, 4, 5, 6, 7}
o1 = s1 - s2
o2 = s2 - s1
o3 = s1 & s2
有没有办法更有效地计算这些集合? 我想不同的集合操作有多个共同的内部处理步骤,因此可能存在冗余。
鉴于这些操作是在语言核心部分的 C 中实现的,我认为您几乎无法在自定义编写的代码中加速这些操作。
但...
由于s1 - s2
与s1 - (s1 & s2)
相同,您可以先计算o3
并在差分运算中使用这个较小的集合:
s1 = {1, 2, 3, 4, 5}
s2 = {3, 4, 5, 6, 7}
o3 = s1 & s2
o1 = s1 - o3
o2 = s2 - o3
我怀疑它会产生很大的不同,因为集合查找和插入是 O(1),但可以想象,对较小集合的操作仍然稍微快一些。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.