[英]How to interpret the height of a cluster based on a correlation matrix?
我正在基于对称相关矩阵创建一个集群。 该矩阵的值从 0 到 1。
docs <- dist(as.matrix(data), method = "euclidean")
hclust_dist<- as.dist(docs)
hclust_dist[is.na(hclust_dist)] <- 0
hclust_dist[is.nan(hclust_dist)] <- 0
sum(is.infinite(hclust_dist)) # THIS SHOULD BE 0
h <- hclust(hclust_dist, "ward.D2")
plot(h, cex=0.6)
当我 plot 我得到了这个集群:
我希望将集群划分为相关分数阈值为 0.7 的不同组。 这意味着同一组中的单元共享最小 0.7 的相关性分数。
但是,我的高度 go 值从 0 到 30。
任何人都知道我如何解释这个高度以将其转换为从 0 到 1 的相关分数?
或者,我需要使用不同的聚类方法吗?
我找到了一个可能的解决方案。
我尝试了相关集群,而不是我在这段代码中使用的集群:
data= read.csv(file="individuo21.csv", sep =";", header = T, row.names = 1)
dissimilarity= 1 - data
distance = as.dist(dissimilarity)
h<-(hclust(distance))
plot(h, cex=0.3)
groups <- cutree(h, h=0.70)
View(groups)
我有一个高度从 0 到 1 的集群,比如相关分数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.