繁体   English   中英

集群呈现树状图替代在r

[英]cluster presentation dendrogram alternative in r

我知道树状图很受欢迎。 但是,如果有大量的观察和课程,很难遵循。 但是有时我觉得应该有更好的方式呈现相同的东西。 我有一个想法,但不知道如何实现它。

考虑以下树形图。

> data(mtcars)
> plot(hclust(dist(mtcars)))

在此输入图像描述

可以将其绘制成散点图。 其中两点之间的距离用线绘制,而sperate簇(假设阈值)是彩色的,圆的大小由某个变量的值确定。

在此输入图像描述

您正在描述一种相当典型的聚类分析方法:

  • 使用聚类算法(在这种情况下是分层聚类)
  • 确定集群的数量
  • 使用某种形式或主成分分析在二维平面中投影数据

编码:

hc <- hclust(dist(mtcars))
cluster <- cutree(hc, k=3)
xy <- data.frame(cmdscale(dist(mtcars)), factor(cluster))
names(xy) <- c("x", "y", "cluster")
xy$model <- rownames(xy)

library(ggplot2)
ggplot(xy, aes(x, y)) + geom_point(aes(colour=cluster), size=3)

接下来会发生的是,你会得到一位熟练的统计学家来帮助解释x和y轴的含义。 这通常涉及将数据投影到轴并提取因子载荷。

剧情:

在此输入图像描述

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM