如何使用 multiprocessing.Manager()？

Question

我担心 python 中的multiprocessing.Manager() 。 这是示例：

import multiprocessing

def f(ns):
    ns.x *=10
    ns.y *= 10

if __name__ == '__main__':
    manager = multiprocessing.Manager()
    ns = manager.Namespace()
    ns.x = 1
    ns.y = 2

    print 'before', ns
    p = multiprocessing.Process(target=f, args=(ns,))
    p.start()
    p.join()
    print 'after', ns

输出是：

before Namespace(x=1, y=2)
after Namespace(x=10, y=20)

到目前为止，它按我的预期工作，然后我像这样修改了代码：

import multiprocessing

def f(ns):
    ns.x.append(10)
    ns.y.append(10)

if __name__ == '__main__':
    manager = multiprocessing.Manager()
    ns = manager.Namespace()
    ns.x = []
    ns.y = []

    print 'before', ns
    p = multiprocessing.Process(target=f, args=(ns,))
    p.start()
    p.join()
    print 'after', ns

现在输出是：

before Namespace(x=[], y=[])
after Namespace(x=[], y=[])

我很困惑为什么列表没有按照我的预期进行更改。 谁能帮我弄清楚发生了什么？

Answer 1

管理器代理对象无法传播对容器内（非托管）可变对象所做的更改。 因此，换句话说，如果您有一个manager.list()对象，则对托管列表本身的任何更改都会传播到所有其他进程。 但是，如果你有一个列表内的正常Python列表，在列表内的任何变化都不会传播的，因为经理没有检测变化的方式。

为了传播更改，您还必须对嵌套列表使用manager.list()对象（需要Python 3.6 或更高版本），或者您需要直接修改manager.list()对象（请参阅有关manager.list()的说明manager.list Python 3.5 或更早版本中的manager.list ）。

例如，考虑以下代码及其输出：

import multiprocessing
import time

def f(ns, ls, di):
    ns.x += 1
    ns.y[0] += 1
    ns_z = ns.z
    ns_z[0] += 1
    ns.z = ns_z

    ls[0] += 1
    ls[1][0] += 1 # unmanaged, not assigned back
    ls_2 = ls[2]  # unmanaged...
    ls_2[0] += 1
    ls[2] = ls_2  # ... but assigned back
    ls[3][0] += 1 # managed, direct manipulation

    di[0] += 1
    di[1][0] += 1 # unmanaged, not assigned back
    di_2 = di[2]  # unmanaged...
    di_2[0] += 1
    di[2] = di_2  # ... but assigned back
    di[3][0] += 1 # managed, direct manipulation

if __name__ == '__main__':
    manager = multiprocessing.Manager()
    ns = manager.Namespace()
    ns.x = 1
    ns.y = [1]
    ns.z = [1]
    ls = manager.list([1, [1], [1], manager.list([1])])
    di = manager.dict({0: 1, 1: [1], 2: [1], 3: manager.list([1])})

    print('before', ns, ls, ls[2], di, di[2], sep='\n')
    p = multiprocessing.Process(target=f, args=(ns, ls, di))
    p.start()
    p.join()
    print('after', ns, ls, ls[2], di, di[2], sep='\n')

输出：

before
Namespace(x=1, y=[1], z=[1])
[1, [1], [1], <ListProxy object, typeid 'list' at 0x10b8c4630>]
[1]
{0: 1, 1: [1], 2: [1], 3: <ListProxy object, typeid 'list' at 0x10b8c4978>}
[1]
after
Namespace(x=2, y=[1], z=[2])
[2, [1], [2], <ListProxy object, typeid 'list' at 0x10b8c4630>]
[2]
{0: 2, 1: [1], 2: [2], 3: <ListProxy object, typeid 'list' at 0x10b8c4978>}
[2]

如您所见，当一个新值直接分配给托管容器时，它会发生变化； 当它被分配给托管容器内的可变容器时，它不会改变； 但是如果可变容器然后被重新分配给托管容器，它会再次更改。 使用嵌套的托管容器也可以直接检测更改，而无需重新分配给父容器。

Answer 2

ns是一个 NamespaceProxy 实例。 这些对象具有特殊的__getattr__ 、 __setattr__和__delattr__方法，允许跨进程共享值。 为了在更改值时利用此机制，您必须触发__setattr__ 。

ns.x.append(10)

导致ns.__getattr__被调用来检索ns.x ，但它不会导致ns.__setattr__被调用。

要解决此问题，您必须使用ns.x = ... 。

def f(ns):   
    tmp = ns.x     # retrieve the shared value
    tmp.append(10)
    ns.x = tmp     # set the shared value

如何使用 multiprocessing.Manager()？

问题描述

2 个解决方案

解决方案1
73 已采纳 2012-02-24 19:30:58

解决方案2
23 2012-02-24 19:35:52

如何使用 multiprocessing.Manager()？

问题描述

2 个解决方案

解决方案1 73 已采纳 2012-02-24 19:30:58

解决方案2 23 2012-02-24 19:35:52

解决方案1
73 已采纳 2012-02-24 19:30:58

解决方案2
23 2012-02-24 19:35:52