簡體   English   中英

R如何可視化成對對齊

[英]R How to visualize pairwise alignment

如何可視化兩個序列的完全比對?

library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)

輸出:

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: [1] ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC---...CTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG 
subject: [1] GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTA...TATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC 
score: -394.7115 

在這里,僅顯示了部分對齊? 您知道繪制或打印路線的任何現有功能嗎?

您可以在?pairwiseAlignments下找到有關如何提取對齊的模式和主題序列的信息和詳細信息。

這是一個基於您提供的樣本數據的示例:

  1. 將成對對齊方式存儲在PairwiseAlignmentsSingleSubject對象中

     alg <- pairwiseAlignment(s1,s2) 
  2. 提取對齊的模式和主題序列,並將它們合並到DNAStringSet對象中。

     seq <- c(alignedPattern(alg), alignedSubject(alg)) 
  3. 您可以使用as.character訪問完整序列

     as.character(seq) [1] "ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC--------TTCACCAGCTCCCTGGCGGTAAGTTGATC---AAAGG---AAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG" [2] "GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAA-ATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC" 

    似乎alignedPatternalignedSubject是最近才添加到Biostrings 或者你可以做

     seq <- c(aligned(pattern(alg)), aligned(subject(alg))) 

    但請注意,這會修剪全局對齊的序列(請參閱詳細信息 )。

  4. 有一個不錯的R / Bioconductor軟件包DECIPHER ,它提供了一種在Web瀏覽器中可視化XStringSet數據的方法。 它會在底部自動添加顏色編碼和共識序列。 在你的情況下,你會做

     library(DECIPHER) BrowseSeqs(seq) 

    在此處輸入圖片說明

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM