[英]How to find bytecodes of matches?
我确实有一个字节码字符串以及所有匹配项的字节码中的开始和结束索引(来自texteditor)。
示例mystring
:
a few names with accents are Emily Brontë, Noël Coward, Zoë Wanamaker
当我搜索包含“ ë
的单词时,我在文本编辑器中找到了这些(字节码)索引:
matches = [[35, 43], [44, 49], [58, 62]]
现在,我想使用python pe在这些匹配项中进行搜索,以找到字母o
所有子字符串,并在mystring
找到这些o
的新字节码。
newmatches = []
for n in matches:
for m in reg.finditer(str(mystring[n[0]:n[1]], 'utf-8')):
newmatches.append([m.start(), m.end()])
在上面的示例中,start()和end()不是字节码,也不是mystring
索引,而是子字符串中的索引。
我该如何解决这个问题?
要获取mystring
中的索引而不是子字符串中的索引,您需要将n[0]
的值添加到start()和end()两者中。
之后,你有你的matches
阵列,做第二个搜索mystring
,你找到的指数o
(让我们把这种新的阵列o_matches
)。 然后遍历该项目o_matches
-如果该项目包含在任何您的间隔在你matches
阵,然后将其添加到newmatches
,因为这意味着它是一个包含一个重音单词的一部分。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.