[英]DNA string into fragments
set.seed(101)
genome <- paste(sample(c("A", "C", "T", "G"), 1000, replace = TRUE), collapse = "")
我需要根据上述顺序创建50个片段。 我尝试使用for循环,但无法弄清楚。 请帮忙。 我是R编程新手。
基因组被组织成20个基因,每个基因的长度为50个碱基。 基因组中的前50个碱基对应于基因1,接下来的50个碱基对应于基因2,依此类推。
你可以试试
res1 <- strsplit(genome, '(?<=.{50})', perl=TRUE)[[1]]
nchar(res1)
#[1] 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50
或使用stringi
library(stringi)
res2 <- stri_extract_all_regex(genome, '.{1,50}')[[1]]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.