繁体   English   中英

我可以在 Pool.imap 调用的 function 中使用多处理队列吗?

[英]Can I use a multiprocessing Queue in a function called by Pool.imap?

我正在使用 python 2.7,并尝试在自己的进程中运行一些 CPU 繁重的任务。 我希望能够将消息发送回父进程,以使其了解进程的当前状态。 多处理队列似乎很适合这个,但我不知道如何让它工作。

所以,这是我的基本工作示例,不使用队列。

import multiprocessing as mp
import time

def f(x):
    return x*x

def main():
    pool = mp.Pool()
    results = pool.imap_unordered(f, range(1, 6))
    time.sleep(1)

    print str(results.next())

    pool.close()
    pool.join()

if __name__ == '__main__':
    main()

我试过以多种方式传递队列,但他们收到错误消息“RuntimeError:队列对象只能通过继承在进程之间共享”。 这是我根据我发现的较早答案尝试的方法之一。 (我在尝试使用 Pool.map_async 和 Pool.imap 时遇到同样的问题)

import multiprocessing as mp
import time

def f(args):
    x = args[0]
    q = args[1]
    q.put(str(x))
    time.sleep(0.1)
    return x*x

def main():
    q = mp.Queue()
    pool = mp.Pool()
    results = pool.imap_unordered(f, ([i, q] for i in range(1, 6)))

    print str(q.get())

    pool.close()
    pool.join()

if __name__ == '__main__':
    main()

最后,0 适应度方法(使其全局化)不会生成任何消息,它只是锁定。

import multiprocessing as mp
import time

q = mp.Queue()

def f(x):
    q.put(str(x))
    return x*x

def main():
    pool = mp.Pool()
    results = pool.imap_unordered(f, range(1, 6))
    time.sleep(1)

    print q.get()

    pool.close()
    pool.join()

if __name__ == '__main__':
    main()

我知道它可能会直接与 multiprocessing.Process 一起使用,并且还有其他库可以实现这一点,但我不想放弃非常适合的标准库函数,直到我确定这不仅仅是我所缺少的知识使我无法利用它们。

谢谢。

诀窍是将Queue作为参数传递给初始化程序。 似乎可以与所有Pool调度方法一起使用。

import multiprocessing as mp

def f(x):
    f.q.put('Doing: ' + str(x))
    return x*x

def f_init(q):
    f.q = q

def main():
    jobs = range(1,6)

    q = mp.Queue()
    p = mp.Pool(None, f_init, [q])
    results = p.imap(f, jobs)
    p.close()

    for i in range(len(jobs)):
        print q.get()
        print results.next()

if __name__ == '__main__':
    main()

使用fork启动方法(即,在 Unix 平台上),您不需要在最佳答案中使用该初始化程序技巧

只需将mp.Queue定义为全局变量,它就会被子进程正确继承。

OP 的示例在 Linux 上使用 Python 3.9.7 运行良好(代码略有调整):

import multiprocessing as mp
import time

q = mp.Queue()


def f(x):
    q.put(str(x))
    return x * x


def main():
    pool = mp.Pool(5)
    pool.imap_unordered(f, range(1, 6))
    time.sleep(1)

    for _ in range(1, 6):
        print(q.get())

    pool.close()
    pool.join()


if __name__ == '__main__':
    main()

Output:

2
1
3
4
5

已经 12 年了,但我想确保遇到这个问题的任何 Linux 用户都知道只有在您不能使用 fork 时才需要最佳答案的技巧

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM