np.nan 和 np.inf 的 Numba 性能問題

Question

我正在玩numba來加速我的代碼。 我注意到在 function 中使用np.inf而不是np.nan時，性能差異很大。 下面我附上了三個示例函數進行說明。

function1不會被numba加速。
function2和function3都由numba加速，但一個使用np.nan而另一個使用np.inf 。

在我的機器上，三個函數的平均運行時間分別為0.032284s 、 0.041548s和0.019712s 。 使用np.nan似乎比np.inf慢得多。 為什么性能差異很大？ 提前致謝。

編輯：我正在使用Python 3.7.11和Numba 0.55.Orc1 。

import numpy as np
import numba as nb

def function1(array1, array2):
    nr, nc = array1.shape
    output1 = np.empty((nr, nc), dtype='float')
    output2 = np.empty((nr, nc), dtype='float')
    output1[:] = np.nan
    output2[:] = np.nan

    for r in range(nr):
        row1 = array1[r]
        row2 = array2[r]
        diff = row1 - row2
        id_threshold =np.nonzero( (row1 - row2) > 8 )
        output1[r][id_threshold] = 1
        output2[r][id_threshold] = 0

    output1 = output1.flatten()
    output2 = output2.flatten()
    id_keep = np.nonzero(output1 != np.nan)
    output1 = output1[id_keep]
    output2 = output2[id_keep]
    output = np.vstack((output1, output2))
    return output

@nb.njit('float64[:,::1](float64[:,::1], float64[:,::1])', parallel=True)
def function2(array1, array2):
    nr, nc = array1.shape
    output1 = np.empty((nr,nc), dtype='float')
    output2 = np.empty((nr, nc), dtype='float')
    output1[:] = np.nan
    output2[:] = np.nan

    for r in nb.prange(nr):
        row1 = array1[r]
        row2 = array2[r]
        diff = row1 - row2
        id_threshold =np.nonzero( (row1 - row2) > 8 )
        output1[r][id_threshold] = 1
        output2[r][id_threshold] = 0

    output1 = output1.flatten()
    output2 = output2.flatten()
    id_keep = np.nonzero(output1 != np.nan)
    output1 = output1[id_keep]
    output2 = output2[id_keep]
    output = np.vstack((output1, output2))
    return output

@nb.njit('float64[:,::1](float64[:,::1], float64[:,::1])', parallel=True)
def function3(array1, array2):
    nr, nc = array1.shape
    output1 = np.empty((nr,nc), dtype='float')
    output2 = np.empty((nr, nc), dtype='float')
    output1[:] = np.inf
    output2[:] = np.inf

    for r in nb.prange(nr):
        row1 = array1[r]
        row2 = array2[r]
        diff = row1 - row2
        id_threshold =np.nonzero( (row1 - row2) > 8 )
        output1[r][id_threshold] = 1
        output2[r][id_threshold] = 0
    output1 = output1.flatten()
    output2 = output2.flatten()
    id_keep = np.nonzero(output1 != np.inf)
    output1 = output1[id_keep]
    output2 = output2[id_keep]
    output = np.vstack((output1, output2))
    return output


array1 = 10*np.random.random((1000,1000))
array2 = 10*np.random.random((1000,1000))

output1 = function1(array1, array2)
output2 = function2(array1, array2)
output3 = function3(array1, array2)

Answer 1

第二個要慢得多，因為output1.= np.nan返回一個副本output1 ，因為np.nan.= np.nan為True （與任何其他值一樣 - v.= np.nan始終為 true）。 因此，要計算的結果數組要大得多，從而導致執行速度變慢。

關鍵是您絕不能使用比較運算符將值與np.nan進行比較：改用np.isnan(value) 。 在您的情況下，您應該使用np.logical_not(np.isnan(output1)) 。

由於np.logical_not創建的臨時數組，第二個實現可能會稍微慢一些（在更正代碼后，我沒有看到在我的機器上使用 NaN 或 Inf 之間有任何統計上的顯着差異）。

np.nan 和 np.inf 的 Numba 性能問題

問題描述

1 個解決方案

解決方案1
3 已采納 2022-01-17 19:36:08

np.nan 和 np.inf 的 Numba 性能問題

問題描述

1 個解決方案

解決方案1 3 已采納 2022-01-17 19:36:08

解決方案1
3 已采納 2022-01-17 19:36:08