繁体   English   中英

按列名称拆分R中的矩阵

[英]split matrix in R by column name

我有6列的矩阵,例如:

c_1 C_2 A_1 A_2 D_1 D_2 ..
 2  3  3  3  3  3  3
 4  4  4  4  2  2  2

我想打破这三个具有相同前缀的矩阵:

c_1 c_2
2  3
4  4

A_1 A_2
3 3
4 4 

假设矩阵中大小写混合的c小写是错别字,则类似这样的方法应该起作用:

m <- matrix(1:12,2,6)
colnames(m) <- paste(rep(letters[1:3],each = 2),1:2,sep = '_')
out <- split.data.frame(t(m),f = substr(rownames(t(m)),1,1))
out <- lapply(out,t)
> out
$a
     a_1 a_2
[1,]   1   3
[2,]   2   4

$b
     b_1 b_2
[1,]   5   7
[2,]   6   8

$c
     c_1 c_2
[1,]   9  11
[2,]  10  12

这取决于您到底要做什么。 这里有一些例子:

mat <- structure(c(3L, 4L, 3L, 4L, 3L, 4L, 3L, 2L, 3L, 2L, 3L, 2L), 
                 .Dim = c(2L,6L), 
                 .Dimnames = list(c("2", "4"), c("c_1", "c_2", "A_1", "A_2","D_1", "D_2")))

如果您只想手动提取一些行,则可以使用

mat[,1:2]
mat[,3:4]
mat[,5:6]

如果要根据列名的第一个字母执行此操作,则可以手动选择所需的列名:

mat[,substr(colnames(mat), 1, 1)=="A"]

或者您可以获得包含所有可能列名的列表

lst <- lapply(unique(substr(colnames(mat),1,1)), 
          function(x) mat[,substr(colnames(mat), 1, 1)==x])
names(lst) <- unique(substr(colnames(mat),1,1))
lst

尝试类似的方法:

library(stringr)
spl <- read.table(header=TRUE, text='
c_1 C_2 A_1 A_2 D_1 D_2 ..
2  3  3  3  3  3  3
4  4  4  4  2  2  2')
spl
names(spl) <- lapply(names(spl), tolower) # not sure if you want "c_1" w/ "C_2"
lapply(split(data.frame(t(spl)), str_extract(names(spl), "[A-Za-z]")), t)
# $a
# a_1 a_2
# X1   3   3
# X2   4   4
# 
# $c
# c_1 c_2
# X1   2   3
# X2   4   4
# 
# $d
# d_1 d_2
# X1   3   3
# X2   2   2

#or
lapply(split(data.frame(t(spl)), substr(names(spl), 1, 1)), t) # includes ".."

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM