簡體   English   中英

使用python 2.7和regex使用子字符串的開頭和結尾(密碼子)查找子字符串

[英]Using python 2.7 and regex to find substring using beginning and end of substring (codons)

(python 2.7)我有一個 RNA 序列,我試圖找到所有以“AUG”開頭並以“UAG”或“UGA”或“UAA”結尾的非重疊子串,這就是我正在使用的:

import re
sequence = GAUGCAAAAUAAAUGAUGUAAUAA
search = r"^(AUG(.)*(?:UAG|UAA|UGA))" 
regions = re.findall(search, sequence)
print regions

輸出應為“AUGCAAAA”和“AUGAUG”。 但是我得到了整個區域'AUGCAAAAUAAAUGAUGUAAUAA'

看起來你需要使用

AUG.*?(?=UAG|UAA|UGA)

看到這個正則表達式演示

詳情

  • AUG - 匹配AUG
  • .*? - 除換行符以外的任何 0+ 個字符,在第一個之前盡可能少......
  • (?=UAG|UAA|UGA) - UAGUAAUGA (它們不是返回值的一部分,因為該模式位於作為零寬度斷言的正前瞻內)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM