[英]R Cluster with grouped data
我是R.的新手。我有以下數據表:
22 1045 4 166.834
23 1047 2 131.567
26 1054 2 43.583
28 1057 2 280.184
34 1064 1 134.608
44 1081 1 70.862
47 1086 2 27.156
50 1094 2 259.189
51 1096 4 216.103
56 1109 2 429.679
59 1115 1 76.770
該表已按第三列分組。 我要做的就是繪制一個Matrix,它表明有3個Cluster(例如1,2-3,4)。 有一個簡單的方法嗎?
提前致謝
對我來說,有一種方法可以構建樹狀圖。
1.建立距離矩陣:
d<-dist(yourmatrix[,4])
I suppose that your 4th column has values:166.834,131.567 and so on.
2.建立集群:
hc<-hclust(d)
3.最后,繪制你的樹狀圖:
plot(hc)
對於您的數據
head(df)
x y cluster z
1 22 1045 4 166.834
2 23 1047 2 131.567
3 26 1054 2 43.583
4 28 1057 2 280.184
5 34 1064 1 134.608
6 44 1081 1 70.862
您可以像下面這樣形象化:
library(scatterplot3d)
scatterplot3d(df$x, df$y, df$z, color=df$cluster, pch=19, xlab='x', ylab='y', zlab = 'z')
legend("topright", legend=1:4, pch=19, col=1:4, title='cluster')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.