繁体   English   中英

计算 Python 中两组的差异和交集的最有效方法

[英]Most efficient way to compute differences and intersection of two sets in Python

假设我们有两组s1s2

我需要基于这两个集合的三个不同的集合:

  1. 存在于s1但不存在于s2中的元素集。
  2. 存在于s2但不存在于s1中的元素集。
  3. s1s2中都存在的一组元素。

这些可以很容易地计算如下:

s1 = {1, 2, 3, 4, 5}
s2 = {3, 4, 5, 6, 7}

o1 = s1 - s2
o2 = s2 - s1
o3 = s1 & s2

有没有办法更有效地计算这些集合? 我想不同的集合操作有多个共同的内部处理步骤,因此可能存在冗余。

鉴于这些操作是在语言核心部分的 C 中实现的,我认为您几乎无法在自定义编写的代码中加速这些操作。

但...

由于s1 - s2s1 - (s1 & s2)相同,您可以先计算o3并在差分运算中使用这个较小的集合:

s1 = {1, 2, 3, 4, 5}
s2 = {3, 4, 5, 6, 7}

o3 = s1 & s2
o1 = s1 - o3
o2 = s2 - o3

我怀疑它会产生很大的不同,因为集合查找和插入是 O(1),但可以想象,对较小集合的操作仍然稍微快一些。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM