![](/img/trans.png)
[英]R get highest x cells and their rownames/colnames in a symmetric matrix?
[英]Matching rownames that are equal to colnames (of a symmetric or asymmetric matrix)
我正在对R中的距离矩阵进行统计分析,并希望比较个体之间和群体之间的距离。 我有一个矩阵,其中一些colnames等于一些rownames。 我想提取满足此条件的值(问题是使其在非对称矩阵上工作)。 如果代码可以保存具有符合条件的逻辑值的矩阵,那将是很棒的)
下面显示了一个较小矩阵的示例:
1 2 3 4
1 0.4966143 0.8359290 0.7319204 0.7579902
3 0.7002979 0.8621343 0.5152356 0.7875813
4 0.7406555 0.8371479 0.7103873 0.5530200
我希望它最终像这样
1 2 3 4
1 TRUE FALSE FALSE FALSE
3 FALSE FALSE TRUE FALSE
4 FALSE FALSE FALSE TRUE
如果我能做到没有任何循环,只需矢量化代码,我会很高兴
我们可以使用outer
out <- outer(row.names(m1), colnames(m1), `==`)
dimnames(out) <- dimnames(m1)
out
# 1 2 3 4
#1 TRUE FALSE FALSE FALSE
#3 FALSE FALSE TRUE FALSE
#4 FALSE FALSE FALSE TRUE
或rep
licate的rownames和列名,使length
享有平等,然后做一个==
`dim<-`(row.names(m1)[row(m1)] == colnames(m1)[col(m1)], dim(m1))
注意:正如@NelsonGon建议的那样,当我们将数据( read.table/read.csv
等)作为data.frame
,列名称可以附加前缀X
因为这些是非规范名称,即以数字开头。 要避免这种情况,请在read.table/read.csv
或post过程中使用check.names = FALSE
参数,方法是更改列名
outer(row.names(df), sub("^X","",names(df)),"==")
假设'df'是data.frame标识符对象
m1 <- structure(list(`1` = c(0.4966143, 0.7002979, 0.7406555),
`2` = c(0.835929, 0.8621343, 0.8371479),
`3` = c(0.7319204, 0.5152356, 0.7103873),
`4` = c(0.7579902, 0.7875813, 0.55302)),
class = "data.frame",
row.names = c("1", "3", "4"))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.