string alignment inspired by global DNA sequence allignment

Question

I would like to do something similar to this:

library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)

but with strings like this:

x123 x4531 etc.

instead of DNA alphabet characters. Is anyone aware of a package to achieve this in R or even Python. Thanks!

Answer 1

Biopython's Align module can accept an alphabet of your choice, eg

>>> from Bio import Align
>>> aligner = Align.PairwiseAligner()
>>> aligner.mode = "global"
>>> aligner.alphabet
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> aligner.alphabet += "1234567890"
>>> alignments = aligner.align("X123Y", "B12XYXYXYX")
>>> print(alignments[0])
X-123-Y-----
--||--|-----
-B12-XYXYXYX

string alignment inspired by global DNA sequence allignment

Question

1 answers

solution1
2 2021-12-21 21:30:16

string alignment inspired by global DNA sequence allignment

Question

1 answers

solution1 2 2021-12-21 21:30:16

solution1
2 2021-12-21 21:30:16