![](/img/trans.png)
[英]Fastest way to multiply and sum 4D array with 2D array in python?
[英]Python - Sum 4D Array
給定4D
陣列M: (m, n, r, r)
,我如何求和所有m * n
內矩陣(形狀(r, r)
)以得到新的形狀矩陣(r * r)
?
例如,
M [[[[ 4, 1],
[ 2, 1]],
[[ 8, 2],
[ 4, 2]]],
[[[ 8, 2],
[ 4, 2]],
[[ 12, 3],
[ 6, 3]]]]
我希望結果應該是
[[32, 8],
[16, 8]]
你可以使用einsum :
In [21]: np.einsum('ijkl->kl', M)
Out[21]:
array([[32, 8],
[16, 8]])
其他選項包括將前兩個軸重新整形為一個軸,然后調用sum
:
In [24]: M.reshape(-1, 2, 2).sum(axis=0)
Out[24]:
array([[32, 8],
[16, 8]])
或者調用sum方法兩次:
In [26]: M.sum(axis=0).sum(axis=0)
Out[26]:
array([[32, 8],
[16, 8]])
但是使用np.einsum
更快:
In [22]: %timeit np.einsum('ijkl->kl', M)
100000 loops, best of 3: 2.42 µs per loop
In [25]: %timeit M.reshape(-1, 2, 2).sum(axis=0)
100000 loops, best of 3: 5.69 µs per loop
In [43]: %timeit np.sum(M, axis=(0,1))
100000 loops, best of 3: 6.08 µs per loop
In [33]: %timeit sum(sum(M))
100000 loops, best of 3: 8.18 µs per loop
In [27]: %timeit M.sum(axis=0).sum(axis=0)
100000 loops, best of 3: 9.83 µs per loop
警告:由於許多因素(OS,NumPy版本,NumPy庫,硬件等),timeit基准測試可能會有很大差異。 各種方法的相對性能有時也取決於M的大小。因此,在M更接近實際用例的情況下進行自己的基准測試是值得的。
例如,對於稍大的數組M
,調用sum
方法兩次可能是最快的:
In [34]: M = np.random.random((100,100,2,2))
In [37]: %timeit M.sum(axis=0).sum(axis=0)
10000 loops, best of 3: 59.9 µs per loop
In [39]: %timeit np.einsum('ijkl->kl', M)
10000 loops, best of 3: 99 µs per loop
In [40]: %timeit np.sum(M, axis=(0,1))
10000 loops, best of 3: 182 µs per loop
In [36]: %timeit M.reshape(-1, 2, 2).sum(axis=0)
10000 loops, best of 3: 184 µs per loop
In [38]: %timeit sum(sum(M))
1000 loops, best of 3: 202 µs per loop
到目前為止,最近的numpy(1.7或更新版本)中最簡單的是:
np.sum(M, axis=(0, 1))
這不會構建一個中間數組,因為對np.sum
的重復調用會。
import numpy as np
l = np.array([[[[ 4, 1],
[ 2, 1]],
[[ 8, 2],
[ 4, 2]]],
[[[ 8, 2],
[ 4, 2]],
[[12, 3],
[ 6, 3]]]])
sum(sum(l))
產量
array([[32, 8],
[16, 8]])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.