繁体   English   中英

如何根据相关矩阵解释聚类的高度?

[英]How to interpret the height of a cluster based on a correlation matrix?

我正在基于对称相关矩阵创建一个集群。 该矩阵的值从 0 到 1。

docs <- dist(as.matrix(data), method = "euclidean")
hclust_dist<- as.dist(docs)
hclust_dist[is.na(hclust_dist)] <- 0
hclust_dist[is.nan(hclust_dist)] <- 0
sum(is.infinite(hclust_dist))  # THIS SHOULD BE 0
h <- hclust(hclust_dist, "ward.D2")
plot(h, cex=0.6)

当我 plot 我得到了这个集群:

聚类树状图

我希望将集群划分为相关分数阈值为 0.7 的不同组。 这意味着同一组中的单元共享最小 0.7 的相关性分数。

但是,我的高度 go 值从 0 到 30。

任何人都知道我如何解释这个高度以将其转换为从 0 到 1 的相关分数?

或者,我需要使用不同的聚类方法吗?

我找到了一个可能的解决方案。

我尝试了相关集群,而不是我在这段代码中使用的集群:

data= read.csv(file="individuo21.csv", sep =";", header = T, row.names = 1)

dissimilarity= 1 - data
distance = as.dist(dissimilarity) 
h<-(hclust(distance))
plot(h, cex=0.3)

groups <- cutree(h, h=0.70) 
View(groups)

我有一个高度从 0 到 1 的集群,比如相关分数。

从相关矩阵获得的聚类

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM