簡體   English   中英

完整了解R中Biostrings對象的長DNA序列

[英]Get a complete view of a long DNA sequence of a Biostrings object in R

我嘗試使用Biostrings軟件包在R中獲得DNA序列的反向互補。 序列的長度約為900,我想完全看到它,但是R顯示了一個抽象版本,代碼之間有一些點。 反正有沒有完全得到它?

> library("Biostrings")
> d <- DNAString("CTGTTGAAGCGTCAGATGGATAAGCATCCATAATTTACTGTCCATATCCAAGACCTCATAGTATTCCTCGGGCATGAATTTAATTGGCGGGGTCGGGGTTCAAGTAAGCCGTATTTTGGCTTCGCCGCCGCGAATTTGAATGCGAGGCGTCTCCTCAAAGATGAGTAACGGCGTCCTGGGCTTCACAGAACTTTCGTGAGAAAACTCTAAGACTCTACAGAGATCACAAATGGTTTCAGCCCAGACTCTATTACTTGGGAGTAAGGGGGTTGACAACTCGCCACTCTATTTCCCATCATCTGCCCGCAGCTGCGACTGGGCCGAACCGAGATGGATATAGGAATAAAATGTGGTGGTGTTGCCGTGCTCTTTTCGTCCGCGTGTCCATGGCGAGGACAGCTATTTTCCTCTAAAGCCCATGTAGATCGCCTCGATCCCTCGTAAGACCCGGCTGCAGTCTGACGCCCCGACAAATAAGCTACCGCCTCCTAAACCATCCCCGATTCAGATGCGTGCTAACTTCGTGTTTCGGCCTAGCTTTAAGGGTACCGTCAGTCACCGCGACTCATAGCTGTACTCCTTCAGAATAAGGTAGTCCCGATCGTACACGTAGCTACAGAGGTATCAGACACGAGCTCGCGTCAATTCGACTCTTCGAGGCTGTGTGCCCCAGCTCCTCAGGGATCGCAATTTAGCAATCAAGAGATCTTGCCTCGTATCAATGATTTTCGCAGTTGGGTTCACGCCCCCTACAATAGCGCACCGCCTGTGTGCAAAGAAATTTTCTGGTACGTAAGATTCGAGGGAGTAGGGACGAAACATTCATGGCGATAGCAGATTTCCGAGGGCTACGGTGTAGCGGATACTAACCTCCGCGTGGTATAGATAGATACTTACCAAGGACACATGCTCTTCCTGTATAGCCGTTCCCG")
> rc <- reverseComplement(d)
> rc
  932-letter "DNAString" instance
seq: CGGGAACGGCTATACAGGAAGAGCAT...TGCTTATCCATCTGACGCTTCAACAG

您可以使用toStringas.character

請參閱有關強制XStrings文檔

描述

DNAString,RNAString和AAString類是相似的容器,但具有更多的面向生物學的目的,用於存儲DNA序列(DNAString),RNA序列(RNAString)或氨基酸序列(AAString)。

所有這些容器都是直接從XString虛擬類派生的(沒有其他插槽)。

強迫

在下面的代碼段中,x是一個XString對象。

as.character(x) :將x轉換為字符串。

toString(x) :等同於as.character(x)。

如果執行class(rc)您將看到它是DNAString因此適用本文檔。

只需使用as.character

> d = DNAString(paste0(sample(c("A","C","T","G"),600,TRUE),collapse=""))
> d
  600-letter "DNAString" instance
seq: CACATTTCTGAAGGTGTTGAGCGGCATCATATAAAC...CATAAACATAATTGCTTGTTTAGTCTACCAAACGCT
> as.character(d)
[1] "CACATTTCTGAAGGTGTTGAGCGGCATCATATAAACGCTCCCCCTTCAACTGTATAGTCCGGCACAGTAGGCTTAGGATATCACCGATGTGTCCGCCACGAAGCTCGAAGACCCGCCTCAAACAGGGCGCACGACCCGCTATATCCAACAATGAGTTCGACCCTGGATCCGTGCATTACATAGGCGACATGTGTGAAAAACTTTGCGTATCTCGGGCTTGCGCCTTTACTCCATGACTTTCTTTCGAACCTTAAATGACTGGTGCATACCCCTGCTTGTCCGTAAGGGAACGGACGGTTGGTATATCTTGAGCACGAGTAAGGGCGCTGATACCCCTTTGCTCGTCATTGATGGGCCAATGTGATGTTGACGTTGCTTGAAGGATTGTACTGGGGTTAATTTTTACGGGCGGAATTGGCTTCACAGTAATACGGACTGTGTAACAAGCGAGCCCCTTAAACGTGCAGACACTAAATAGCGGGCGAGTTACCTTTCATCAGGCACAGGTTAACTTTGGAAAAGGTCCACTTGAACCTCATTTGAAACCAAAGACCGTTATATATGCATAAACATAATTGCTTGTTTAGTCTACCAAACGCT"

請注意,您不希望這樣做太多,因為BioStrings努力提高處理長字符串的效率。 如果您嘗試將其寫入文件,則可以使用其他方法...

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM