繁体   English   中英

DNA串成碎片

[英]DNA string into fragments

set.seed(101) 
genome <- paste(sample(c("A", "C", "T", "G"), 1000, replace = TRUE), collapse = "")

我需要根据上述顺序创建50个片段。 我尝试使用for循环,但无法弄清楚。 请帮忙。 我是R编程新手。

基因组被组织成20个基因,每个基因的长度为50个碱基。 基因组中的前50个碱基对应于基因1,接下来的50个碱基对应于基因2,依此类推。

你可以试试

 res1 <- strsplit(genome, '(?<=.{50})', perl=TRUE)[[1]]
 nchar(res1)
 #[1] 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50

或使用stringi

 library(stringi)
 res2 <- stri_extract_all_regex(genome, '.{1,50}')[[1]]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM