字符串 alignment 受全球 DNA 序列比对的启发

Question

我想做类似的事情：

library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)

但有这样的字符串：

x123 x4531 等

而不是 DNA 字母字符。 有谁知道 package 可以在 R 甚至 Python 中实现这一点。 谢谢！

Answer 1

Biopython 的Align模块可以接受您选择的字母表，例如

>>> from Bio import Align
>>> aligner = Align.PairwiseAligner()
>>> aligner.mode = "global"
>>> aligner.alphabet
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> aligner.alphabet += "1234567890"
>>> alignments = aligner.align("X123Y", "B12XYXYXYX")
>>> print(alignments[0])
X-123-Y-----
--||--|-----
-B12-XYXYXYX

字符串 alignment 受全球 DNA 序列比对的启发

问题描述

1 个解决方案

解决方案1
2 2021-12-21 21:30:16

字符串 alignment 受全球 DNA 序列比对的启发

问题描述

1 个解决方案

解决方案1 2 2021-12-21 21:30:16

解决方案1
2 2021-12-21 21:30:16