[英]Find index mapping between two numpy arrays
numpy
中是否有一种很好的方法来获取array1
中每个元素在array2
中的位置的元素索引?
一个例子:
array1 = np.array([1, 3, 4])
array2 = np.arange(-2, 5, 1, dtype=np.int)
np.where(array1[0] == array2)
# (array([3]),)
np.where(array1[1] == array2)
# (array([5]),)
np.where(array1[2] == array2)
# (array([6]),)
我想要做
np.where(array1 == array2)
# (array([3 5 6]),)
这样的事情可能吗? 我们保证array1
中的所有条目都可以在array2
中找到。
方法#1:在其中使用np.in1d
获取发生匹配的位置的掩码,然后在np.where
中获得那些索引位置的掩码-
np.where(np.in1d(array2, array1))
方法2:使用np.searchsorted
np.searchsorted(array2, array1)
请注意,如果未对array2
进行排序,则需要将其与可选的可选参数sorter
一起使用。
样品运行-
In [14]: array1
Out[14]: array([1, 3, 4])
In [15]: array2
Out[15]: array([-2, -1, 0, 1, 2, 3, 4])
In [16]: np.where(np.in1d(array2, array1))
Out[16]: (array([3, 5, 6]),)
In [17]: np.searchsorted(array2, array1)
Out[17]: array([3, 5, 6])
运行时测试-
In [62]: array1 = np.random.choice(10000,1000,replace=0)
In [63]: array2 = np.sort(np.random.choice(100000,10000,replace=0))
In [64]: %timeit np.where(np.in1d(array2, array1))
1000 loops, best of 3: 483 µs per loop
In [65]: %timeit np.searchsorted(array2, array1)
10000 loops, best of 3: 40 µs per loop
如果您的 arrays 不是太大,这是一种更简单的方法。
np.equal.outer(array1,array2).argmax(axis=1)
如果 array1 的大小为 N,array2 的大小为 M,这将创建一个形状为 (N,M) 的临时数组,因此如果 arrays 太大以至于无法放入 memory,则不建议使用上述方法。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.