[英]R How to visualize pairwise alignment
如何可視化兩個序列的完全比對?
library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)
輸出:
Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: [1] ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC---...CTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG
subject: [1] GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTA...TATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC
score: -394.7115
在這里,僅顯示了部分對齊? 您知道繪制或打印路線的任何現有功能嗎?
您可以在?pairwiseAlignments
下找到有關如何提取對齊的模式和主題序列的信息和詳細信息。
這是一個基於您提供的樣本數據的示例:
將成對對齊方式存儲在PairwiseAlignmentsSingleSubject
對象中
alg <- pairwiseAlignment(s1,s2)
提取對齊的模式和主題序列,並將它們合並到DNAStringSet
對象中。
seq <- c(alignedPattern(alg), alignedSubject(alg))
您可以使用as.character
訪問完整序列
as.character(seq) [1] "ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC--------TTCACCAGCTCCCTGGCGGTAAGTTGATC---AAAGG---AAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG" [2] "GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAA-ATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC"
似乎alignedPattern
和alignedSubject
是最近才添加到Biostrings
。 或者你可以做
seq <- c(aligned(pattern(alg)), aligned(subject(alg)))
但請注意,這會修剪全局對齊的序列(請參閱詳細信息 )。
有一個不錯的R / Bioconductor軟件包DECIPHER
,它提供了一種在Web瀏覽器中可視化XStringSet
數據的方法。 它會在底部自動添加顏色編碼和共識序列。 在你的情況下,你會做
library(DECIPHER) BrowseSeqs(seq)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.