繁体   English   中英

在目录中按顺序排列`rbind`数据集

[英]`rbind` dataset by sequence in a directory

我有一个具有相同行号和行号的数据集。 我想按两个顺序重新rbind这些数据。

例如,对于数据5LSTT-test12_1.avgm5LSTT-test12_1_sum.avgm我首先要使用rbind合并它们,并用新名称保存它们,例如test12.avgm 应该对同一目录中的每个两个文件执行此过程。

我已经检查了网络,但是大多数将数据合并到单个文件中的解决方案。 我不知道如何合并两个数据并将其保存为单个数据,然后执行此操作处理路径中的所有文件。

数据集是这样的

5LSTT-test12_1.avgm   
5LSTT-test12_1_sum.avgm  
5LSTT-test13_1.avgm   
5LSTT-test13_1_sum.avgm  
.  
.   
.  
.  
5LSTT-test30_1.avgm   
5LSTT-test30_1_sum.avgm  

假设对象名称('v1')的向量是有序的,我们可以使用gl splitsplit每个列表元素2个元素。 我不确定这些对象是否已在全局环境中。 在这种情况下,我们可以使用mget并将do.call(rbind, lapply(x, read.table)替换为do.call(rbind, mget(x))

lst <- lapply(split(v1,as.numeric(gl(length(v1), 2, length(v1)))), 
               function(x) do.call(rbind,lapply(x, read.table)))

用“ nm1”更改“ lst”的名称

nm1 <- sprintf('test%d.avgm', 12:30)
names(lst) <- nm1

如果需要创建新文件,可以执行以下操作:

lapply(seq_along(lst), function(i) write.table(lst[[i]], 
                     paste0(nm1[i],'.txt'), quote=FALSE))

数据

v1 <- sort(sprintf('5LSTT-test%d_1.%s', 12:30,
               rep(c('avgm', 'sum.avgm'),each=19)))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM