Python多处理代码运行速度比单线程处理慢

Question

我的i7 7700HQ上的Python多处理性能明显慢于非并行处理。

计划在mssql中为我的单表数据库并行化我的Select和Update代码时，我尝试首先并行化一个简单代码。 该程序只打印参数的倍数。 我尝试使用Process对象以及Pool对象的单线程，多进程。 单线程始终表现最佳。

import time

def foobar(a):
    for i in range(1,10000):
        print(a*i)
    return
if __name__ == "__main__":
   Tthreading = time.clock()
    p1= Process(target= foobar, args=(3,))
    p2 = Process(target= foobar, args= (2,))
    p3 = Process(target= foobar, args= (4,))
    p4 = Process(target=foobar, args=(123,))

    allprocess.start

    allprocess.join

    print(time.clock() - Tthreading)

    #Single-threaded
    Tsingle = time.clock()
    foobar(3)
    foobar(2)
    foobar(4)
    foobar(123)
    print(time.clock() - Tsingle)

我期望多进程会更快，因为没有共享资源（没有函数，线程之间需要访问的变量）和IPC。

单线程时间：0.32s

多处理时间：0.53s

Answer 1

实际上，示例中有一个重要的共享资源，即监视器（或stdout ）。

print是一个相对较慢的操作（与CPU周期相比...），它会导致进程之间的争用。

对并行工作进行正确的基准测试是一项艰巨的任务，它受CPU（例如高速缓存）的众多因素和功能的影响。

尝试用非常适合多处理的工作负载代替工作负载（例如，并行处理数组的不同部分，矩阵乘法...）

更为重要的一件事是：产生新流程也需要时间，并且要使每个流程中完成的工作还清，这是很重要的。 如果稍微增加循环的范围，则区别应该是多进程版本：

import time
from multiprocessing import Process

def foobar(a):
    for i in range(1,10000000):
        a*i
    return

if __name__ == "__main__":
    Tthreading = time.time()
    p1= Process(target= foobar, args=(3,))
    p2 = Process(target= foobar, args= (2,))
    p3 = Process(target= foobar, args= (4,))
    p4 = Process(target=foobar, args=(123,))

    allprocess = [p1,p2,p3,p4]
    for p in allprocess:
        p.start()

    for p in allprocess:
        p.join()

    print(time.time() - Tthreading)

    #Single-threaded
    Tsingle = time.time()
    foobar(3)
    foobar(2)
    foobar(4)
    foobar(123)
    print(time.time() - Tsingle)

在我的机器上，输出：

0.44509196281433105

1.3775699138641357

Python多处理代码运行速度比单线程处理慢

问题描述

1 个解决方案

解决方案1
2 已采纳 2019-05-30 06:44:47

Python多处理代码运行速度比单线程处理慢

问题描述

1 个解决方案

解决方案1 2 已采纳 2019-05-30 06:44:47

解决方案1
2 已采纳 2019-05-30 06:44:47