[英]How to check efficiently if numpy array a contains b
如何检查一个numpy数组a是否有效地包含另一个numpy数组? 有点像b是a的子集....
谢谢!
编辑:a和b是一维numpy数组
如果你问b
是一个连续的子阵列 a
从算法上讲,如果其中一个数组可以包含重复值,则问题等同于单模式字符串搜索问题 。 这个问题有几种已知的算法。 不幸的是,两者都不太简单。
另外,通过首先查找b
的第一个元素,然后比较以下所有元素,实现起来很简单:
import numpy as np
def is_subarray_no_repeatition(a, b):
try:
i = np.where(a == b[0])[0][0]
except IndexError:
# either b is empty, or b[0] not in a
return b.size == 0
a = a[i : i+b.size]
if a.size < b.size:
return False
return (a == b).all()
如果你问b
是的一个子集 a
(即每个元素b
中存在a
)
def is_subset(a, b):
b = np.unique1d(b)
c = np.intersect1d(a,b)
return c.size == b.size
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.