為什么 numba 的 parallel=True 使這個計算慢了 3 倍？

Question

這樣做時：

import numpy as np
from numba import jit

@jit
def doit(A, Q, n):
    for i in range(len(Q)):
        Q[i] = np.sum(A[i:i+n] <= A[i+n])

A = np.random.random(1000*1000)
n = 5000
Q = np.zeros(len(A)-n)    
doit(A, Q, n)

在我的電腦上運行時大約需要 5.4 秒。

我嘗試使用 numba 的並行化功能：

@jit(parallel=True)
def doit(A, Q, n):
    for i in range(len(Q)):
        Q[i] = np.sum(A[i:i+n] <= A[i+n])

相反，它需要 17 秒。

為什么 numba 的parallel=True使這個計算慢了 3 倍而不是更快？

Answer 1

我剛剛找到答案：缺少一個字符： p range 而不是 range：

from numba import jit, prange

@jit(parallel=True)
def doit(A, Q, n):
    for i in prange(len(Q)):
       ...

然后需要 1.8 秒而不是 5.4 秒：並行化工作。

為什么 numba 的 parallel=True 使這個計算慢了 3 倍？

問題描述

1 個解決方案

解決方案1
1 已采納 2018-11-06 11:05:20

為什么 numba 的 parallel=True 使這個計算慢了 3 倍？

問題描述

1 個解決方案

解決方案1 1 已采納 2018-11-06 11:05:20

解決方案1
1 已采納 2018-11-06 11:05:20