繁体   English   中英

以k表示选择簇数

[英]Choosing number of clusters in k means

我想聚类大量数据,为此我在MATLAB中使用了k均值函数。 问题是它返回一个矩阵,其中所有数据都按我指定的簇数排序。

我怎么知道哪个簇是最佳的。

我以为,如果我在每个群集中得到相等数量的元素,那将是最佳选择,但这永远不会发生。 相反,它可以继续对我输入的任何数字进行数据聚类。

请帮忙...

我读了一下,我认为对此的答案可能是:-在kmeans中,我们试图根据数据出现时的方式对数据进行分区,因此从理论上讲,我们最好的数据集将是每个分区具有相等数量的数据。

我使用kmeans ++是一种比kmeans更好的算法,因为它不初始化随机值,然后遍历分区的数量直到分区的大小几乎相等。 这是一个大概的数字,比如说3我得到2180,729,1219,而4我得到30,2422,1556,120,所以我选择3作为我的最终答案.......

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM