繁体   English   中英

Python:集群入门

[英]Python: getting started with clustering

我试图了解 python 的层次聚类模块中的这个链接函数的作用(无法从文档或其他更复杂的问题中理解)。

我尝试了一个随机向量的例子。 我不知道从哪里开始弄清楚这是在做什么,为什么链接中有 12 个数字,它们是什么?

谢谢

dist_vec=np.random.randint(1,10,6)
print dist_vec
[4 2 2 6 5 1]

# create linkage
Z = linkage(dist_vec, method='single')

# distance = 0.8 as cutoff
clusters = fcluster(Z, 0.8, criterion='distance')

print Z
[[ 2.  3.  1.  2.]
[ 0.  4.  2.  3.]
[ 1.  5.  4.  4.]]

scipy 文档中解释了输出格式。

这是两个集群 ID,高度和点数。

我强烈建议从二维欧几里得玩具数据开始。 不是随机距离矩阵(会不一致)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM