繁体   English   中英

R中许多相同点的k均值

[英]k-means for many same points in R

假设我有一个一维数据集,其中包含许多相同的数字,例如数据集S = c(rep(4, times(1000)), rep(5, times(808)), rep(9, times(990))) 有任何有效的方法可以在R中进行k均值吗? 实际上,在我的数据中,我只有大约20个不同的点,但是每个点出现大约100000次,运行非常缓慢。 所以我想知道是否有更有效的方法。

K均值可以通过权重实现。 这样做很简单。

但是IIRC包含在R中的版本不是用这种方式实现的。 flexcluster上的版本可能是,但是它是纯R flexcluster得多。

无论哪种方式,您都想像常规的kmeans版本一样,在Fortran或C中实现。 也许您可以找到一些已经实现良好的程序包。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM