簡體   English   中英

python正則表達式重復字符

[英]python regular expression repeated characters

我正在尋找在python中創建一個正則表達式,以匹配所有以T開頭,后跟18字符(任意字符),然后以AATTCCGG終止的DNA序列。 我可以管理第一部分,但是我似乎找不到不重復4次正則表達式的寫結尾(雙字符)的方法。 這是我以TT結尾的序列的內容:

import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match

查看一個好的教程

有一個叫做交替的概念。 它與任何給定選項匹配:

r'T.{18}(?:TT|AA|CC|GG)'

請注意,您應該使用原始字符串在Python中對正則表達式進行編碼,否則以后會遇到轉義字符的問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM