将3D numpy数组有效转换为1D numpy数组

Question

我有这种形式的3D numpy数组：

>>>img.shape
(4504932, 2, 2)

>>> img
array([[[15114, 15306],
    [15305, 15304]],

   [[15305, 15306],
    [15303, 15304]],

   [[15305, 15306],
    [15303, 15304]],

   ..., 

   [[15305, 15302],
    [15305, 15302]]], dtype=uint16)

我想将其转换为一个1D numpy数组，其中每个条目都是上述img numpy数组中每个2x2子矩阵的总和。

我已经能够使用以下方法完成此任务：

img_new = np.array([i.sum() for i in img])
>>> img_new
array([61029, 61218, 61218, ..., 61214, 61214, 61214], dtype=uint64)

这正是我想要的。 但这太慢了（大约需要10秒）。 有没有我可以使用的更快的方法？ 我在img.shape上面包含了它，因此您对这个numpy数组的大小有所了解。

编辑-其他信息：我的img数组也可以是4x4、5x5、7x7等子矩阵形式的3D数组。 这由变量sub_rows和sub_cols指定。

Answer 1

img.sum(axis=(1, 2))

sum允许您指定一个或多个沿轴求和，而不仅仅是对整个数组求和。 这使NumPy可以在C语言中循环遍历数组，并且每个和仅执行几条机器指令，而不必经过Python字节码评估循环并创建大量包装对象以粘贴在列表中。

Answer 2

通常，使用numpy方法（ apply_over_axes ）更快，实际上就是这种情况。 我刚刚在4000x2x2阵列上进行了测试：

img = np.random.rand(4000,2,2)
timeit(np.apply_along_axis(np.sum, img, [1,2]))
# 1000 loops, best of 3: 721 us per loop
timeit(np.array([i.sum() for i in img]))
# 100 loops, best of 3: 17.2 ms per loop

Answer 3

您可以使用np.einsum

img_new = np.einsum('ijk->i',img)

验证结果

In [42]: np.array_equal(np.array([i.sum() for i in img]),np.einsum('ijk->i',img))
Out[42]: True

运行时测试

In [34]: img = np.random.randint(0,10000,(10000,2,2)).astype('uint16')

In [35]: %timeit np.array([i.sum() for i in img]) # Original approach
10 loops, best of 3: 92.4 ms per loop

In [36]: %timeit img.sum(axis=(1, 2)) # From other solution
1000 loops, best of 3: 297 µs per loop

In [37]: %timeit np.einsum('ijk->i',img)
10000 loops, best of 3: 102 µs per loop

将3D numpy数组有效转换为1D numpy数组

问题描述

3 个解决方案

解决方案1
4 已采纳 2015-06-16 22:49:13

解决方案2
0 2015-06-16 22:55:22

解决方案3
0 2015-06-17 05:02:05

将3D numpy数组有效转换为1D numpy数组

问题描述

3 个解决方案

解决方案1 4 已采纳 2015-06-16 22:49:13

解决方案2 0 2015-06-16 22:55:22

解决方案3 0 2015-06-17 05:02:05

解决方案1
4 已采纳 2015-06-16 22:49:13

解决方案2
0 2015-06-16 22:55:22

解决方案3
0 2015-06-17 05:02:05