Numpy：获取索引大于值且条件为真的数组

Question

我有以下数组：

a = np.array([6,5,4,3,4,5,6])

现在我想获取所有大于 4 但索引值也大于 2 的元素。我发现这样做的方法如下：

a[2:][a[2:]>4]

有没有更好或更易读的方法来实现这一点？

更新：这是一个简化版本。 实际上，索引是通过对几个变量的算术运算完成的，如下所示：

a[len(trainPredict)+(look_back*2)+1:][a[len(trainPredict)+(look_back*2)+1:]>4]

trainPredict是一个 numpy 数组， look_back是一个 integer。
我想看看是否有既定的方式或其他人如何做到这一点。

Answer 1

如果您担心切片的复杂性和/或条件的数量，您可以随时将它们分开：

a = np.array([6,5,4,3,4,5,6])

a_slice = a[2:]

cond_1 = a_slice > 4

res = a_slice[cond_1]

您的示例是否非常简化？ 对于更复杂的操作，可能有更好的解决方案。

Answer 2

@AlexanderCécile 的答案不仅比您发布的那条更易读，而且还消除了临时数组的冗余计算。 尽管如此，它似乎并不比您原来的方法快。

下面的时间都是在初步设置下运行的

import numpy as np
np.random.seed(0xDEADBEEF)
a = np.random.randint(8, size=N)

N从 1e3 到 1e8 变化为 10 倍。我尝试了四种代码变体：

CodePope： result = a[2:][a[2:] > 4]
AlexanderCécile: s = a[2:]; result = s[s > 4] s = a[2:]; result = s[s > 4]
MadPhysicist1： result = a[np.flatnonzero(a[2:]) + 2]
MadPhysicist2： result = a[(a > 4) & (np.arange(a.size) >= 2)]

在所有情况下，时间都是在命令行上通过运行获得的

python -m timeit -s 'import numpy as np; np.random.seed(0xDEADBEEF); a = np.random.randint(8, size=N)' '<X>'

这里， N是 3 和 8 之间的 10 的幂，而<X>是上述表达式之一。 时间安排如下：

方法#1 和#2 几乎无法区分。 令人惊讶的是，在 ~5e3 和 ~1e6 元素之间的范围内，方法#3 似乎稍微慢一些，但明显更快。 我通常不会从花哨的索引中期望这一点。 方法#4 当然是最慢的。

为了完整起见，这里是数据：

           CodePope  AlexanderCécile  MadPhysicist1  MadPhysicist2
1000       3.77e-06         3.69e-06       5.48e-06       6.52e-06
10000       4.6e-05         4.59e-05       3.97e-05       5.93e-05
100000     0.000484         0.000483         0.0004       0.000592
1000000     0.00513          0.00515        0.00503        0.00675
10000000     0.0529           0.0525         0.0617          0.102
100000000     0.657            0.658          0.782           1.09

Numpy：获取索引大于值且条件为真的数组

问题描述

2 个解决方案

解决方案1
2 2019-10-09 18:23:58

解决方案2
1 2019-10-10 03:11:27

Numpy：获取索引大于值且条件为真的数组

问题描述

2 个解决方案

解决方案1 2 2019-10-09 18:23:58

解决方案2 1 2019-10-10 03:11:27

解决方案1
2 2019-10-09 18:23:58

解决方案2
1 2019-10-10 03:11:27