[英]`rbind` dataset by sequence in a directory
我有一个具有相同行号和行号的数据集。 我想按两个顺序重新rbind
这些数据。
例如,对于数据5LSTT-test12_1.avgm
和5LSTT-test12_1_sum.avgm
我首先要使用rbind
合并它们,并用新名称保存它们,例如test12.avgm
。 应该对同一目录中的每个两个文件执行此过程。
我已经检查了网络,但是大多数将数据合并到单个文件中的解决方案。 我不知道如何合并两个数据并将其保存为单个数据,然后执行此操作处理路径中的所有文件。
数据集是这样的
5LSTT-test12_1.avgm
5LSTT-test12_1_sum.avgm
5LSTT-test13_1.avgm
5LSTT-test13_1_sum.avgm
.
.
.
.
5LSTT-test30_1.avgm
5LSTT-test30_1_sum.avgm
假设对象名称('v1')的向量是有序的,我们可以使用gl
split
其split
每个列表元素2个元素。 我不确定这些对象是否已在全局环境中。 在这种情况下,我们可以使用mget
并将do.call(rbind, lapply(x, read.table)
替换为do.call(rbind, mget(x))
lst <- lapply(split(v1,as.numeric(gl(length(v1), 2, length(v1)))),
function(x) do.call(rbind,lapply(x, read.table)))
用“ nm1”更改“ lst”的名称
nm1 <- sprintf('test%d.avgm', 12:30)
names(lst) <- nm1
如果需要创建新文件,可以执行以下操作:
lapply(seq_along(lst), function(i) write.table(lst[[i]],
paste0(nm1[i],'.txt'), quote=FALSE))
v1 <- sort(sprintf('5LSTT-test%d_1.%s', 12:30,
rep(c('avgm', 'sum.avgm'),each=19)))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.