繁体   English   中英

Python中的递归组合字符串搜索

[英]Recursive combination string searching in Python

我正在尝试编写一种算法,该算法将字符串a和更长的字符串b作为参数,并返回与b中的字母相对应的所有可能的索引有序组合。 (我承认,这对问题的定义很差。不太清楚该如何措辞。希望下面的示例可以阐明我的意思。)

以下是有关输入参数的一些假设。

  1. ab中的所有字母均大写。
  2. len( a )<len( b
  3. 只有存在于a中的字母才会出现在b中 即set( a )== set( b
  4. ab中都允许使用重复的字母。

例:

如果a =“ SLSQ”和b =“ SQLSSQLSQ”,则结果如下所示:

result = [
[0,2,3,5],
[0,2,3,8],
[0,2,4,5],
[0,2,4,8],
[0,2,7,8],
[0,6,7,8],
[3,6,7,8],
[4,6,7,8]]

另一种看待它的方式; 我明确写出了上面示例中递归算法的结果。 数字是b的字母的索引。

0123456789
SQLSSQLSQS      SLSQ
S LS Q      ->  0235
S LS    Q   ->  0238
S L SQ      ->  0245
S L S   Q   ->  0248
S L    SQ   ->  0278
S     LSQ   ->  0678
   S  LSQ   ->  3678
    S LSQ   ->  4678

我相当确定我可以写一个蛮力算法来解决这个问题,但是我真正想要的是一个干净易处理的pythonic递归算法。 不幸的是,我的递归编码技巧并不那么令人印象深刻。 这是我到目前为止的内容:

def recurse(a_str, b_str, res):

    if len(a_str) == 0:
        return _, _, res
    for token in b_str:
        if token == a_str[0]:
            _ = a_str[0]
            _, _, res = recurse(a_str[1:], b_str, res)
        else:
            _, _, res = recurse(a_str, b_str[1:], res)
    return _, _, res

“ _”只是占位符,直到我弄清楚下一步该怎么做。 我的脑袋疼。 任何建议将不胜感激。

这里是一个递归版本跟踪的指数abaibi

def recurse(a_str, b_str, ai=0, bi=0):
    if not a_str:
        return
    if ai < len(a_str):
        b_lim = len(b_str) - len(a_str) + ai + 1
        for i in range(bi, b_lim):
            if a_str[ai] == b_str[i]:
                for r in recurse(a_str, b_str, ai+1, i+1):
                    yield (i,) + r
    else:
        yield ()

list(recurse(a, b))
[(0, 2, 3, 5),
 (0, 2, 3, 8),
 (0, 2, 4, 5),
 (0, 2, 4, 8),
 (0, 2, 7, 8),
 (0, 6, 7, 8),
 (3, 6, 7, 8),
 (4, 6, 7, 8)]

itertools的组合将帮助您轻松实现此目的。 因此您无需为此编写手动递归函数。

a = "SLSQ"
b = "SQLSSQLSQ"
B = zip(b, xrange(0,len(b)))
from itertools import combinations
res = []
for i in combinations(B, 4):
    bstr = "".join(map(lambda x:x[0], i))
    if a.__contains__(bstr):
        res.append(map(lambda x:x[1], i))

for i in res:
    print i

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM