[英]Reg ex - find part of string
我有這種類型的數據(重復多次):
@@@FFDFFHHHHHJJFFHGIJJJJGI
@M00332:5:000000000-A0TVJ:1:1:13498:26189 2:N:0:1
ACCACAGCCGCTGCCCATTTGCATAA
+
使用正則表達式我試圖選擇包含特定字符串cagccgctgcccatttg
所有行。 我是一個正則表達式的新手,所以我試過這個: \\w{3,}(cagccgctgcccatttg)\\w{3,}
任何幫助深表感謝。
干杯西蒙
根據我的理解,您希望收集包含單個子序列的所有序列。 我不知道你正在使用什么環境,但是這應該以非常簡單的方式返回你正在尋找的任何序列。
([ACGT]{3,}CAGCCGCTGCCCATTTG[ACGT]{3,})
括號是一個字符類,這意味着它匹配內部的任何單個字符。 你不想匹配\\ w,你只想匹配一個角色,如果它是你正在尋找的4個角色之一。 此外,您可以使用parens覆蓋整個正則表達式以獲取整個匹配。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.