[英]Union of 2 sets does not contain all items
为什么当我改变下面工会中两套的顺序时,我会得到不同的结果?
set1 = {1, 2, 3}
set2 = {True, False}
print(set1 | set2)
# {False, 1, 2, 3}
print(set2 | set1)
#{False, True, 2, 3}
1
和True
是等价的,被认为是重复的。 同样, 0
和False
也是等价的:
>>> 1 == True
True
>>> 0 == False
True
遇到多个等效值时,set会保持第一个看到的值:
>>> {0, False}
{0}
>>> {False, 0}
{False}
要将它们视为不同,只需将它们存储在(value, type)
对中:
>>> set1 = {(1, int), (2, int), (3, int)}
>>> set2 = {(True, bool), (False, bool)}
>>> set1 | set2
{(3, <class 'int'>), (1, <class 'int'>), (2, <class 'int'>),
(True, <class 'bool'>), (False, <class 'bool'>)}
>>> set1 & set2
set()
使值不同的另一种方法是将它们存储为字符串:
>>> set1 = {'1', '2', '3'}
>>> set2 = {'True', 'False'}
>>> set1 | set2
{'2', '3', 'False', 'True', '1'}
>>> set1 & set2
set()
希望这能揭开神秘面纱并展示前进的方向:-)
从评论中获救:
这是打破交叉类型等价的标准技术(即0.0 == 0
, True == 1
和Decimal(8.5) == 8.5)
。 该技术在Python 2.7的正则表达式模块中使用,以强制unicode正则表达式与其他等效的str正则表达式明显缓存。 当typed参数为true时,该技术也在Python 3中用于functools.lru_cache()。
如果OP需要除默认等价关系之外的其他东西,则需要定义一些新的关系。 根据用例,可能是字符串不区分大小写,unicode规范化,视觉外观(看起来不同的东西被认为是不同的),标识(没有两个不同的对象被认为是相同的),值/类型对或其他一些定义等价关系的函数。 鉴于OP的具体示例,他/她似乎期望按类型或视觉区别进行区分。
在Python中, False
和0
被认为是等价的, True
和1
。 因为True
和1
被认为是相同的值,所以它们中只有一个可以同时出现在一个集合中。 哪一个取决于它们被添加到集合中的顺序。在第一行中, set1
用作第一个集合,因此我们在结果集合中得到1
。 在第二组中, True
在第一组中,因此True
包含在结果中。
如果你看一下https://docs.python.org/3/library/stdtypes.html#boolean-values第4.12.10节。 布尔值:
布尔值是两个常量对象False和True 。 它们用于表示真值(尽管其他值也可以被认为是假或真)。 在数字上下文中(例如,当用作算术运算符的参数时),它们的行为分别与整数0和1相似。
比较运算符( ==
, !=
)定义为布尔值True
和False
以匹配1和0。
这就是为什么,在集合联盟中,当它检查True
是否已经在新集合中时,它会得到一个真正的答案:
>>> True in {1}
True
>>> 1 in {True}
True
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.