![](/img/trans.png)
[英]How to describe string with only repeated characters groups in regular expression in Python
[英]python regular expression repeated characters
我正在尋找在python中創建一個正則表達式,以匹配所有以T
開頭,后跟18
字符(任意字符),然后以AA
, TT
, CC
或GG
終止的DNA序列。 我可以管理第一部分,但是我似乎找不到不重復4次正則表達式的寫結尾(雙字符)的方法。 這是我以TT
結尾的序列的內容:
import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match
查看一個好的教程 。
有一個叫做交替的概念。 它與任何給定選項匹配:
r'T.{18}(?:TT|AA|CC|GG)'
請注意,您應該使用原始字符串在Python中對正則表達式進行編碼,否則以后會遇到轉義字符的問題。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.