R如何可视化成对对齐

Question

如何可视化两个序列的完全比对？

library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)

输出：

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: [1] ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC---...CTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG 
subject: [1] GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTA...TATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC 
score: -394.7115

在这里，仅显示了部分对齐？ 您知道绘制或打印路线的任何现有功能吗？

Answer 1

您可以在?pairwiseAlignments下找到有关如何提取对齐的模式和主题序列的信息和详细信息。

这是一个基于您提供的样本数据的示例：

将成对对齐方式存储在PairwiseAlignmentsSingleSubject对象中
```
 alg <- pairwiseAlignment(s1,s2) 
```
提取对齐的模式和主题序列，并将它们合并到DNAStringSet对象中。
```
 seq <- c(alignedPattern(alg), alignedSubject(alg)) 
```

您可以使用as.character访问完整序列

 as.character(seq) [1] "ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC--------TTCACCAGCTCCCTGGCGGTAAGTTGATC---AAAGG---AAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG" [2] "GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAA-ATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC"

似乎alignedPattern和alignedSubject是最近才添加到Biostrings 。 或者你可以做

 seq <- c(aligned(pattern(alg)), aligned(subject(alg)))

但请注意，这会修剪全局对齐的序列（请参阅详细信息）。

有一个不错的R / Bioconductor软件包DECIPHER ，它提供了一种在Web浏览器中可视化XStringSet数据的方法。 它会在底部自动添加颜色编码和共识序列。 在你的情况下，你会做
```
 library(DECIPHER) BrowseSeqs(seq) 
```

R如何可视化成对对齐

问题描述

1 个解决方案

解决方案1
7 2018-09-17 12:45:16

R如何可视化成对对齐

问题描述

1 个解决方案

解决方案1 7 2018-09-17 12:45:16

解决方案1
7 2018-09-17 12:45:16