簡體   English   中英

Reg ex - 找到字符串的一部分

[英]Reg ex - find part of string

我有這種類型的數據(重復多次):

@@@FFDFFHHHHHJJFFHGIJJJJGI   
@M00332:5:000000000-A0TVJ:1:1:13498:26189 2:N:0:1   
ACCACAGCCGCTGCCCATTTGCATAA 
+

使用正則表達式我試圖選擇包含特定字符串cagccgctgcccatttg所有行。 我是一個正則表達式的新手,所以我試過這個: \\w{3,}(cagccgctgcccatttg)\\w{3,}

任何幫助深表感謝。

干杯西蒙

根據我的理解,您希望收集包含單個子序列的所有序列。 我不知道你正在使用什么環境,但是這應該以非常簡單的方式返回你正在尋找的任何序列。

([ACGT]{3,}CAGCCGCTGCCCATTTG[ACGT]{3,})

括號是一個字符類,這意味着它匹配內部的任何單個字符。 你不想匹配\\ w,你只想匹配一個角色,如果它是你正在尋找的4個角色之一。 此外,您可以使用parens覆蓋整個正則表達式以獲取整個匹配。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM