[英]k-means for many same points in R
假设我有一个一维数据集,其中包含许多相同的数字,例如数据集S = c(rep(4, times(1000)), rep(5, times(808)), rep(9, times(990)))
。 有任何有效的方法可以在R中进行k均值吗? 实际上,在我的数据中,我只有大约20个不同的点,但是每个点出现大约100000次,运行非常缓慢。 所以我想知道是否有更有效的方法。
K均值可以通过权重实现。 这样做很简单。
但是IIRC包含在R中的版本不是用这种方式实现的。 flexcluster
上的版本可能是,但是它是纯R flexcluster
得多。
无论哪种方式,您都想像常规的kmeans版本一样,在Fortran或C中实现。 也许您可以找到一些已经实现良好的程序包。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.