Python Multiprocessing pool.map对太多工作进程无响应

Question

堆栈溢出的第一个问题，请耐心等待。 我正在寻找计算组评分（长numpy数组）的方差。 在没有并行处理的情况下运行程序可以很好地工作，但是鉴于每个进程可以独立运行，因此我希望有32个组可以利用多处理来加快处理速度。 对于少于10个的少量组，这可以正常工作，但是在此之后，程序似乎似乎会在没有指定数量的组（通常为20到30个）之间停止运行，并且没有错误消息，尽管会一直运行的频率较低。 数组很大（21451 x 11462用户项目评分），所以我想知道问题是否是由于没有足够的内存而引起的，尽管没有打印错误消息。

import numpy as np
from functools import partial
import multiprocessing

def variance_parallel(extra_matrices, group_num):
    # do some variation calculation
    # print confirmation that we have entered function, and group number
    return single_group_var

def variance(extra_matrices, num_groups):
    variance_partial = partial(variance_parallel, extra_matrices)
    for g in list(range(num_groups)):
        group_var = pool.map(variance_partial,range(g))
    return(group_var)     

num_cores = multiprocessing.cpu_count() - 1
pool = multiprocessing.Pool(processes=num_cores)
variance(extra_matrices, num_groups)

运行上面的代码显示该程序逐步构建正在检查方差的组数（[0]，[0,1]，[0,1,2]，...），然后最终什么也不打印。

如果我的格式/问题有点问题，请提前感谢您的帮助和歉意！

Answer 1

多个进程不共享数据
发送到流程的数据需要复制

由于阵列很大，因此问题很可能与将大型阵列复制到进程有关。 此外，在Python的多处理过程中，将数据发送到进程是通过序列化完成的，序列化是（a）CPU密集型的，并且（b）自身需要额外的内存。

简而言之，多重处理并不适合您的用例。 由于numpy是本机代码扩展（不适用于GIL），并且是线程安全的，因此最好使用线程而不是多处理。 使用线程，辅助线程可以通过其父进程的地址空间共享数据，从而不必进行复制。

那应该阻止程序耗尽内存。

但是，要使线程共享地址空间，它们共享的数据需要绑定到对象，例如python类。

如下所示-未经测试，因为代码示例不完整。

import numpy as np
from functools import partial
from threading import Thread
from multiprocessing import cpu_count

class Variance(Thread):

    def __init__(self, extra_matrices, group_num):
        Thread.__init__(self)
        self.extra_matrices = extra_matrices
        self.group_num = group_num
        self.output = None

    def run(self):
        # do some variation calculation
        # print confirmation that we have entered function, and group number
        self.output = single_group_var

num_cores = cpu_count() - 1
results = []
for g in list(range(num_groups)):
    workers = [Variance(extra_matrices, range(g)) 
               for _ in range(num_cores)]
    # Start threads
    for worker in workers:
        worker.start()
    # Wait for completion
    for worker in workers:
        worker.join()
    results.extend([w.output for w in workers])
print results

Python Multiprocessing pool.map对太多工作进程无响应

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-07-11 17:08:55

Python Multiprocessing pool.map对太多工作进程无响应

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-07-11 17:08:55

解决方案1
0 已采纳 2017-07-11 17:08:55