为什么两级字典的值都指向Python 2.7中的同一个对象？

Question

我试图定义一个函数来创建一个双层字典，所以它应该生成格式

dict = {tier1:{tier2:value}}.

代码是：

def two_tier_dict_init(tier1,tier2,value):
    dict_name = {}
    for t1 in tier1:
        dict_name[t1] = {}
        for t2 in tier2:
            dict_name[t1][t2] = value
    return dict_name

所以下面的例子

tier1 = ["foo","bar"]
tier2 = ["x","y"]
value = []
foobar_dict = two_tier_dict_init(tier1,tier2,value)

从它的表面产生我想要的东西：

foobar_dict =  {'foo':{'x': [],'y':[]},
                'bar':{'x': [],'y':[]}}                   }

但是，当附加任何值时

foobar_dict["foo"]["x"].append("thing")

所有值都被附加，因此结果为：

foobar_dict =  {'foo':{'x': ["thing"],'y':["thing"]},
                'bar':{'x': ["thing"],'y':["thing"]}}

起初我假设由于我的定义构建字典的方式，所有值都指向内存中的相同空间，但我无法弄清楚为什么会出现这种情况。 然后我发现如果我将值从空列表更改为整数，当我执行以下操作时，

foobar_dict["foo"]["x"] +=1

仅更改所需的值。

因此，我必须得出结论，这与list.append方法有关，但我无法弄清楚。 解释是什么？

注意我需要这个函数来构建大型字典词典，其中每个层都有数百个元素。 我也使用相同的方法来构建一个出现相同问题的三层版本。

Answer 1

您只传入了一个列表对象，而第二层字典仅存储了对该对象的引用。

如果需要存储不同的列表，则需要为每个条目创建一个新列表。 您可以为此使用工厂函数：

def two_tier_dict_init(tier1, tier2, value_factory):
    dict_name = {}
    for t1 in tier1:
        dict_name[t1] = {}
        for t2 in tier2:
            dict_name[t1][t2] = value_factory()
    return dict_name

然后使用：

two_tier_dict_init(tier1, tier2, list)

让它创建空列表。 您可以在此处使用任何可调用的值工厂，包括lambda如果要存储字符串或整数之类的不可变对象）：

two_tier_dict_init(tier1, tier2, lambda: "I am shared but immutable")

您可以使用dict理解来简化您的功能：

def two_tier_dict_init(tier1, tier2, value_factory):
    return {t1: {t2: value_factory() for t2 in tier2} for t1 in tier1}

Answer 2

之所以发生这种情况，是因为您使用作为值传递的相同列表填充所有第二层dicts，并且所有条目都指向相同的列表对象。

一种解决方案是复制每个属性的列表：

dict_name [t1] [t2] =值[：]

这仅在您确定值始终为列表时才有效。

可以复制任何对象（包括嵌套列表和字典）的另一个更通用的解决方案是深度复制：

dict_name [t1] [t2] = copy.deepcopy（value）

如果用不可变对象（如数字或字符串）填充dicts，内部所有条目也会引用同一个对象，但不会发生不良影响，因为数字和字符串是不可变的。

Answer 3

所有值都引用相同的列表对象。 当您在该列表对象上调用append()时，所有字典值似乎都在同时更改。

创建列表更改的副本

        dict_name[t1][t2] = value

至

        dict_name[t1][t2] = value[:]

或者

        dict_name[t1][t2] = copy.deepcopy(value)

前者将制作浅层（即一层）副本，后者将进行深层复制。

Answer 4

之所以对int起作用，是因为它们是不可变的，并且增强的赋值（ +=和朋友）会像普通的赋值语句一样重新命名（可能会返回到同一对象）。 当你这样做：

foobar_dict["foo"]["x"] +=1

你最终用另一个替换旧的int对象。 int不具备就地更改值的功能，因此加法生成（或可能找到，因为CPython实习了某些int）具有新值的另一个int。

因此，即使foobar_dict["foo"]["x"]和foobar_dict["foo"]["y"]以相同的int开头（并且他们确实如此），添加其中一个使它们现在包含不同的 int。

如果您使用更简单的变量进行尝试，您可以看到这种差异：

>>> a = b = 1
>>> a is b
True
>>> a += 1
>>> a 
2
>>> b
1

另一方面， list是可变的，并且调用append不会进行任何重新绑定。 因此，正如您所怀疑的那样，如果foobar_dict["foo"]["x"]和foobar_dict["foo"]["y"]是相同的列表（并且它们是 - 请用is检查），并附加到它，他们仍然是同一个名单。

为什么两级字典的值都指向Python 2.7中的同一个对象？

问题描述

4 个解决方案

解决方案1
6 已采纳 2014-01-29 13:54:04

解决方案2
1 2014-01-29 14:03:12

解决方案3
0 2014-01-29 13:53:46

解决方案4
0 2014-01-29 14:11:34

为什么两级字典的值都指向Python 2.7中的同一个对象？

问题描述

4 个解决方案

解决方案1 6 已采纳 2014-01-29 13:54:04

解决方案2 1 2014-01-29 14:03:12

解决方案3 0 2014-01-29 13:53:46

解决方案4 0 2014-01-29 14:11:34

解决方案1
6 已采纳 2014-01-29 13:54:04

解决方案2
1 2014-01-29 14:03:12

解决方案3
0 2014-01-29 13:53:46

解决方案4
0 2014-01-29 14:11:34