[英]Python: getting started with clustering
我试图了解 python 的层次聚类模块中的这个链接函数的作用(无法从文档或其他更复杂的问题中理解)。
我尝试了一个随机向量的例子。 我不知道从哪里开始弄清楚这是在做什么,为什么链接中有 12 个数字,它们是什么?
谢谢
dist_vec=np.random.randint(1,10,6)
print dist_vec
[4 2 2 6 5 1]
# create linkage
Z = linkage(dist_vec, method='single')
# distance = 0.8 as cutoff
clusters = fcluster(Z, 0.8, criterion='distance')
print Z
[[ 2. 3. 1. 2.]
[ 0. 4. 2. 3.]
[ 1. 5. 4. 4.]]
scipy 文档中解释了输出格式。
这是两个集群 ID,高度和点数。
我强烈建议从二维欧几里得玩具数据开始。 不是随机距离矩阵(会不一致)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.