[英]Recursive combination string searching in Python
我正在尝试编写一种算法,该算法将字符串a和更长的字符串b作为参数,并返回与b中的字母相对应的所有可能的索引有序组合。 (我承认,这对问题的定义很差。不太清楚该如何措辞。希望下面的示例可以阐明我的意思。)
以下是有关输入参数的一些假设。
例:
如果a =“ SLSQ”和b =“ SQLSSQLSQ”,则结果如下所示:
result = [
[0,2,3,5],
[0,2,3,8],
[0,2,4,5],
[0,2,4,8],
[0,2,7,8],
[0,6,7,8],
[3,6,7,8],
[4,6,7,8]]
另一种看待它的方式; 我明确写出了上面示例中递归算法的结果。 数字是b的字母的索引。
0123456789
SQLSSQLSQS SLSQ
S LS Q -> 0235
S LS Q -> 0238
S L SQ -> 0245
S L S Q -> 0248
S L SQ -> 0278
S LSQ -> 0678
S LSQ -> 3678
S LSQ -> 4678
我相当确定我可以写一个蛮力算法来解决这个问题,但是我真正想要的是一个干净易处理的pythonic递归算法。 不幸的是,我的递归编码技巧并不那么令人印象深刻。 这是我到目前为止的内容:
def recurse(a_str, b_str, res):
if len(a_str) == 0:
return _, _, res
for token in b_str:
if token == a_str[0]:
_ = a_str[0]
_, _, res = recurse(a_str[1:], b_str, res)
else:
_, _, res = recurse(a_str, b_str[1:], res)
return _, _, res
“ _”只是占位符,直到我弄清楚下一步该怎么做。 我的脑袋疼。 任何建议将不胜感激。
这里是一个递归版本跟踪的指数a
和b
为ai
和bi
def recurse(a_str, b_str, ai=0, bi=0):
if not a_str:
return
if ai < len(a_str):
b_lim = len(b_str) - len(a_str) + ai + 1
for i in range(bi, b_lim):
if a_str[ai] == b_str[i]:
for r in recurse(a_str, b_str, ai+1, i+1):
yield (i,) + r
else:
yield ()
list(recurse(a, b))
[(0, 2, 3, 5),
(0, 2, 3, 8),
(0, 2, 4, 5),
(0, 2, 4, 8),
(0, 2, 7, 8),
(0, 6, 7, 8),
(3, 6, 7, 8),
(4, 6, 7, 8)]
itertools的组合将帮助您轻松实现此目的。 因此您无需为此编写手动递归函数。
a = "SLSQ"
b = "SQLSSQLSQ"
B = zip(b, xrange(0,len(b)))
from itertools import combinations
res = []
for i in combinations(B, 4):
bstr = "".join(map(lambda x:x[0], i))
if a.__contains__(bstr):
res.append(map(lambda x:x[1], i))
for i in res:
print i
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.