[英]Python Iterate through characters
我一直试图在ACGT基因组中提取中值串搜索序列。 我遇到的问题是AAAAAAAA到AAAAAAAC等等,直到我尝试了所有可能的组合。
通过创建两个列表,一个包含A,C,G,T和另一个包含8个字符的序列,以及每次搜索迭代和交换字符后,我基本上都在蛮力。 问题是我没有测试所有组合,因为当两个迭代同时它跳过一个字母。
有什么方法可以轻松地去AAAAAAAA - AAAAAAAC - AAAAAAAG - AAAAAAAT - AAAAAACA等吗?
itertools.product("ACGT", repeat=8)
如上所述使用itertools,
itertools.product("ACGT", repeat=8) # will work in your case.
使用pyparsing wiki示例页面中的正则表达式逆变器 ,反转此正则表达式: [ACGT]{8}
。 您也可以在UtilityMill上尝试在线变频器 ,但是这个服务器在生成8个字符的字符串时会超时,但我已经在允许的时间内成功获得了6个字符。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.